生成AIによる編集ワークフロー

業種: メディア、電気通信

製品およびツール： MongoDB Atlas、MongoDB Atlas Vector Search

パートナー: Amazon Bedrock

ソリューション概要

コンテンツチームは、高速化されたニュース環境で魅力的で信頼できるコンテンツを生成するための負荷が増大しています。従来の方法では、手動検索、ソース検証、ツール管理に費やされた時間が原因で、コンテンツ作成というよりは「作成遅延」や「機会」が失われることがよくあります。MongoDBでは、ジェネレーティブAIと MongoDB の適応型データインフラストラクチャを組み合わせて、編集操作を最適化できます。これらの機能をテストするために、コンテンツラボのデモは複製可能なソリューションを提供します。

コンテンツラボデモを使用すると、編集ワークフローが効率化され、次のことが可能になります。

さまざまなコンテンツを取り込んで構造化: このデモは、さまざまなソースからの大量の非構造化および半構造化コンテンツを効率的に処理し、トピック、業界、およびソースメタデータごとに動的に整理します。
AIによる検出とドラフトの有効化: 埋め込みモデルとMongoDB Atlas Vector Searchにより、未加工のコンテンツが構造化された検索可能なデータに変換されます。この組み合わせにより、トレンドトピックのセマンティックな取得が可能になり、コンテンツのドラフト作成が自動化され、クリック数が軽減されます。
コンテンツの信頼性の向上: このデモではソース URL をキャプチャして保存し、トピックの提案に直接埋め込みます。外部検索エージェントと統合すると、コンテキスト情報を持つコンテンツの提案がさらに豊富になります。
パーソナライズを容易にし、ワークフローの効率を向上させます: このデモでは、ユーザーのプロファイルを処理してパーソナライズされた書き込みの提案を提供し、バージョン管理と再利用のためにドラフトを保存します。MongoDB の柔軟なスキーマにより、ワークフローを中断することなく、プロファイルデータ、ドラフト形式、新しいコンテンツタイプに簡単に対応できるようになります。

クリックして拡大します

図の 1。ユーザージャーナル図

このデモは、統合ストレージソリューション、リアルタイムインサイト、自動コンテンツサポートを提供することで、 MongoDB が編集チームの複雑さを軽減し、コンテンツの品質を向上させ、本番を迅速化するのにどのように機能するかを示しています。アイドルから出版までの明確なパスを出版社に提供します。

リファレンスアーキテクチャ

コンテンツラボのデモは、生成系AIと MongoDB の柔軟なデータインフラストラクチャを組み合わせて編集操作を効率化する、 AI駆動型の公開ツールを提供します。このアーキテクチャは、次の条件を満たすマイクロサービスとして設計されています。

さまざまなコンテンツの取り込みを処理
AIを使用した検出とドラフトのドライバー
コンテンツ信頼性の向上
パーソナライズとワークフローの効率をサポートする

クリックして拡大します

図の 2。コンテンツラボデモの高レベルアーキテクチャ

このアーキテクチャでは、次のコンポーネントが使用されます。

ユーザーインターフェース（UI）: ユーザーはUIを介してシステムとやりとりし、トピックの提案、配置案作成ツール、配置案管理などの機能を提供します。
バックエンドサービス: これらのマイクロサービスは、次のようなデモのさまざまな機能を取り扱います。
- コンテンツ分析とバックエンドの提案 : このサービスは、ニュースレターと Reddit データを処理し、Cohere 埋め込みのような埋め込みモデルを通じてコンテンツをセマンティックベクトルに変換します。これらのベクトルは Atlas ベクトル検索で処理され、リアルタイムのトピックの提案が提供されます。マイクロサービスには、次の主要なコンポーネントがあります。
  - スケジューラーとオーケストレーション: このサービスは、取り込み、埋め込み生成、トピック提案のワークフローを毎日自動化します。
  - ロール: このサービスは、セマンティック検索と検索を使用して、下流の書込み支援と書込み支援のマイクロサービスへのパーソナライズを強化します。
  以下に、このマイクロサービスの概要の図を示します。
  クリックして拡大します
  図の 3。コンテンツとバックエンドの提案に関する高レベルのアーキテクチャ
- 書き込み支援バックエンド: このサービスは、ドラフト概要、検証、コンテンツの削除、チャットの完了など、発行に関するツールを提供します。これらのツールは、Amazon Web Servicesメンバードロックなどの LM を使用します。
MongoDB Atlas: Atlas はプライマリデータストアとして機能し、効率的な処理と取得のためのセマンティック検索機能、データベースストレージ、および集計パイプラインを提供します。

データモデルアプローチ

このデモでは、次のドキュメントモデルの設計とコレクションを使用してコンテンツを保存します。

コンテンツラボデモには、次の 5 つの主要なコレクションがあります。

userProfile
reddit_posts
news
suggestions
drafts

userProfileコレクションには、パーソナライズされたAIベースの提案をカスタマイズするために、個々のユーザーの設定が保存されます。これらの設定には、次のものが含まれます。

persona: ユーザーが選択できるライターのタイプ。
tone: ユーザーが選択できる希望の調度。例、因果関係、形式、または半形式などです。
styleTraits: ライターの事前定義された特性。
sampleText: ライターからの例。

このスキーマは、頻繁にアクセスされるデータをまとめて保存するというMongoDB の設計原則に従い、書き込み支援がユーザーの推奨事項をすばやく検索できるようにします。サンプルドキュメントを以下に示します。

{
  "_id": {
    "$oid": "6862a8988c0f7bf43af995a8"
  },
  "persona": "The Formal Expert",
  "userName": "Mark S.",
  "tone": "Polished, academic, appeals to professionals and older readers",
  "styleTraits": [
    "Long, structured paragraphs",
    "Formal language with rich vocabulary",
    "Analytical, often includes references or citations"
  ],
  "sampleText": "This development represents..."
}

reddit_posts コレクションと news コレクションには、それぞれの API から取り込まれた未加工データが保存されています。これらのドキュメントは、セマンティック検索を可能にするコンテンツの意味を数値的に表現した埋め込みでさらに埋め込みが強化されます。

suggestionsコレクションには、処理された reddit_posts データと news データから提案されたトピックが含まれています。UI はこれらのドキュメントを簡単に見つけ、トピック選択に使用できます。サンプルドキュメントを以下に示します。

{
  "_id": {
    "$oid": "686fb23055303796c4f37b7e"
  },
  "topic": "Backlash against generative AI",
  "keywords": [
    "algorithmic bias",
    "data privacy",
    "AI regulation",
    "public trust"
  ],
  "description": "As generative AI tools like ChatGPT proliferate, a growing public backlash highlights concerns over their negative impacts and the need for stronger oversight.",
  "label": "technology",
  "url": "https://www.wired.com/story/generative-ai-backlash/",
  "type": "news_analysis",
  "analyzed_at": {
    "$date": "2025-07-10T12:29:36.277Z"
  },
  "source_query": "Viral social media content"
}

最後に、draftsコレクションはユーザーのドラフトを保存します。各配置案は推奨されるトピックに関連付けられているため、簡単に組織と取得が可能です。このモデルは、編集ワークフローの永続性、バージョン管理、コンテンツの再利用可能性を確保します。

ソリューションのビルド

このデモを複製するには、次の手順に従います。

リポジトリのフォークとクローン

バックエンド#1、バックエンド#2、フロントエンドリポジトリをGithubアカウントにフォークしてクローンします。

MongoDB Atlas のプロビジョニング

MongoDB Atlasアカウント内に、次のコレクションを含むという名前のクラスターとデータベースを作成します。contentlab

drafts: ユーザー作成のドラフトドキュメントの保存
news: 埋め込み付きのスクレイピングされたニュース記事を保存します。
reddit_posts: 埋め込みを使用して Reddit 投稿とコメントを保存します。
suggestions: AIが生成したトピックの提案を保存します。
userProfiles: ユーザープロファイル情報と設定を保存します。

APIキーを取得する

次のキーを生成して保存します。

環境ファイルを構成する

Atlas URI、データベース名、すべてのAPIキーを各バックエンドの .envファイルに追加します。

依存関係をインストールし、サービスを実行

ポート 8000 と 8001 の両方のバックエンドサービスをインストールして開始します。次に、フロントエンドの依存関係をインストールし、http://localhost:3000. で開発サーバーを起動します。

キーポイント

MongoDB の柔軟なスキーマでデータモデルを調整します。 MongoDBを使用すると、ダウンタイムや複雑な移行なしで、コレクション内に新しいフィールドをシームレスに追加したり、既存のフィールド（カスタムメタデータ、サマリー、バージョン履歴など）を調整することができます。
意味のある検出のために Atlas ベクトル検索を統合する: MongoDBとを使用すると、さまざまな API からの埋め込みをそれぞれのコレクションに保存し、類似性クエリを実行して関連するトピックを秒単位で明らかにします。
コンテンツソースを追跡して編集の信頼性を確保します: MongoDBを使用すると、ソース URL とメタデータを提案と一緒に保存できるため、ソース URL とメタデータを提案と一緒に保存できるため、作成元を簡単に検証でき、ドラフトの信頼性を維持できます。
パイプラインを自動化して提案の一定ストリームを維持 : MongoDBを使用すると、毎日のジョブをスケジュールしてニュースのスクレイピング、埋め込みの処理、最新のトピック推奨を保証する提案を生成できます。

作成者

Aswin Subramanian Mahaswalan、 MongoDB
Felipe Trejos, MongoDB

詳細

Atlas ベクトル検索がセマンティック検索を強化し、リアルタイム分析を可能にする方法については、Atlas ベクトル検索ページをご覧ください。
MongoDB がメディア操作をどのように変換しているかについては、「 AI経由でのメディアのパーソナライズ： MongoDBとベクトル検索」に関する記事をお読みください。
MongoDB が最新のメディアワークフローをどのようにサポートしているかを確認するには、MongoDB for メディアとエンタープライズページをご覧ください。

戻る

AI 主導のメディアパーソナライズ

生成AIを活用した動画要約