業種: メディア、電気通信
製品およびツール: MongoDB Atlas、MongoDB Atlas Vector Search
パートナー: Amazon Bedrock
ソリューション概要
コンテンツチームは、高速化されたニュース環境で魅力的で信頼できるコンテンツを生成するための負荷が増大しています。従来の方法では、手動検索、ソース検証、ツール管理に費やされた時間が原因で、コンテンツ作成というよりは「作成遅延」や「機会」が失われることがよくあります。MongoDBでは、ジェネレーティブAIと MongoDB の適応型データ インフラストラクチャを組み合わせて、編集操作を最適化できます。これらの機能をテストするために、コンテンツ ラボ のデモは複製可能なソリューションを提供します。
コンテンツ ラボ デモを使用すると、編集ワークフローが効率化され、次のことが可能になります。
さまざまなコンテンツを取り込んで構造化: このデモは、さまざまなソースからの大量の非構造化および半構造化コンテンツを効率的に処理し、トピック、 業界、および ソースメタデータごとに動的に整理します。
AIによる検出とドラフトの有効化: 埋め込みモデルとMongoDB Atlas Vector Searchにより、未加工のコンテンツが構造化された検索可能なデータに変換されます。この組み合わせにより、トレンド トピックのセマンティックな取得が可能になり、コンテンツのドラフト作成が自動化され、クリック数が軽減されます。
コンテンツの信頼性の向上: このデモではソース URL をキャプチャして保存し、トピックの提案に直接埋め込みます。外部検索エージェントと統合すると、コンテキスト情報を持つコンテンツの提案がさらに豊富になります。
パーソナライズを容易にし、ワークフローの効率を向上させます: このデモでは、ユーザーのプロファイルを処理してパーソナライズされた書き込みの提案を提供し、バージョン管理と再利用のためにドラフトを保存します。MongoDB の柔軟なスキーマにより、ワークフローを中断することなく、プロファイル データ、ドラフト 形式、新しいコンテンツタイプに簡単に対応できるようになります。
図の 1。ユーザージャーナル図
このデモは、統合ストレージソリューション、リアルタイムインサイト、自動コンテンツ サポートを提供することで、 MongoDB が編集チームの複雑さを軽減し、コンテンツの品質を向上させ、本番を迅速化するのにどのように機能するかを示しています。アイドルから出版までの明確なパスを出版社に提供します。
リファレンスアーキテクチャ
コンテンツ ラボ のデモは、生成系AIと MongoDB の柔軟なデータ インフラストラクチャを組み合わせて編集操作を効率化する、 AI駆動型の公開ツールを提供します。このアーキテクチャは、次の条件を満たすマイクロサービスとして設計されています。
さまざまなコンテンツの取り込みを処理
AIを使用した検出とドラフトのドライバー
コンテンツ信頼性の向上
パーソナライズとワークフローの効率をサポートする
図の 2。コンテンツ ラボ デモの高レベル アーキテクチャ
このアーキテクチャでは、次のコンポーネントが使用されます。
ユーザー インターフェース(UI): ユーザーはUIを介してシステムとやりとりし、トピックの提案、配置案作成ツール、配置案管理などの機能を提供します。
バックエンド サービス: これらのマイクロサービスは、次のようなデモのさまざまな機能を取り扱います。
コンテンツ分析とバックエンドの提案 : このサービスは、ニュースレターと Reddit データを処理し、 Cohere 埋め込み のような埋め込みモデルを通じてコンテンツをセマンティック ベクトルに変換します。これらのベクトルは Atlas ベクトル検索で処理され、リアルタイムのトピックの提案が提供されます。マイクロサービスには、次の主要なコンポーネントがあります。
スケジューラーとオーケストレーション: このサービスは、取り込み、埋め込み生成、トピック提案のワークフローを毎日自動化します。
ロール: このサービスは、セマンティック検索と検索を使用して、書込み支援 (write concern) マイクロサービスへの下流の書込み保証 (write concern) とパーソナライズを強化します。
以下に、このマイクロサービスの概要の図を示します。
クリックして拡大します図の 3。コンテンツとバックエンドの提案に関する高レベルのアーキテクチャ
書き込み支援バックエンド: このサービスは、ドラフト 概要、検証、コンテンツの削除、チャットの完了など、発行に関するツールを提供します。これらのツールは、Amazon Web Servicesメンバードロックなどの LM を使用します。
MongoDB Atlas: Atlas はプライマリ データ ストアとして機能し、効率的な処理と取得のためのセマンティック検索機能、データベースストレージ、および集計パイプライン を提供します。
データモデルアプローチ
このデモでは、次のドキュメントモデルの設計とコレクションを使用してコンテンツを保存します。
コンテンツ ラボ デモには、次の 5 つの主要なコレクションがあります。
userProfile
reddit_posts
news
suggestions
drafts
userProfile
コレクションには、パーソナライズされたAIベースの提案をカスタマイズするために、個々のユーザーの設定が保存されます。これらの設定には、次のものが含まれます。
persona
: ユーザーが選択できるライターのタイプ。tone
: ユーザーが選択できる希望の調度。例、因果関係、形式、または半形式 などです。styleTraits
: ライターの事前定義された特性。sampleText
: ライターからの例。
このスキーマは、頻繁にアクセスされるデータをまとめて保存するというMongoDB の設計原則に従い、書き込み支援がユーザーの推奨事項をすばやく検索できるようにします。サンプルドキュメントを以下に示します。
{ "_id": { "$oid": "6862a8988c0f7bf43af995a8" }, "persona": "The Formal Expert", "userName": "Mark S.", "tone": "Polished, academic, appeals to professionals and older readers", "styleTraits": [ "Long, structured paragraphs", "Formal language with rich vocabulary", "Analytical, often includes references or citations" ], "sampleText": "This development represents..." }
reddit_posts
コレクションと news
コレクションには、それぞれの API から取り込まれた未加工データが保存されています。これらのドキュメントは、セマンティック検索を可能にするコンテンツの意味を数値的に表現した埋め込みでさらに埋め込みが強化されます。
suggestions
コレクションには、処理された reddit_posts
データと news
データから提案されたトピックが含まれています。UI はこれらのドキュメントを簡単に見つけ、トピック選択に使用できます。サンプルドキュメントを以下に示します。
{ "_id": { "$oid": "686fb23055303796c4f37b7e" }, "topic": "Backlash against generative AI", "keywords": [ "algorithmic bias", "data privacy", "AI regulation", "public trust" ], "description": "As generative AI tools like ChatGPT proliferate, a growing public backlash highlights concerns over their negative impacts and the need for stronger oversight.", "label": "technology", "url": "https://www.wired.com/story/generative-ai-backlash/", "type": "news_analysis", "analyzed_at": { "$date": "2025-07-10T12:29:36.277Z" }, "source_query": "Viral social media content" }
最後に、drafts
コレクションはユーザーのドラフトを保存します。各配置案は 推奨されるトピックに関連付けられているため、簡単に組織と取得が可能です。このモデルは、編集ワークフローの永続性、バージョン管理、コンテンツの再利用可能性を確保します。
ソリューションのビルド
このデモを複製するには、次の手順に従います。
MongoDB Atlas のプロビジョニング
MongoDB Atlasアカウント 内に、次のコレクションを含む という名前のクラスターとデータベースを作成します。contentlab
drafts
: ユーザー作成のドラフト ドキュメントの保存news
: 埋め込み付きのスクレイピングされたニュース記事を保存します。reddit_posts
: 埋め込みを使用して Reddit 投稿とコメントを保存します。suggestions
: AIが生成したトピックの提案を保存します。userProfiles
: ユーザー プロファイル情報と設定を保存します。
依存関係をインストールし、サービスを実行
ポート8000 と8001 の両方のバックエンドサービスをインストールして開始します。次に、フロントエンドの依存関係をインストールし、 http://localhost:3000 で開発サーバーを起動します。
キーポイント
MongoDB の柔軟なスキーマでデータモデルを調整します。 MongoDBを使用すると、ダウンタイムや複雑な移行なしで、コレクション内に新しいフィールドをシームレスに追加したり、既存のフィールド(カスタムメタデータ、サマリー、バージョン履歴など)を調整することができます。
意味のある検出のために Atlas ベクトル検索を統合する: MongoDBと を使用すると、さまざまな API からの埋め込みをそれぞれのコレクションに保存し、類似性クエリを実行して関連するトピックを秒単位で明らかにします。
コンテンツソースを追跡して編集の信頼性を確保します: MongoDBを使用すると、ソース URL とメタデータを提案と一緒に保存できるため、ソース URL とメタデータを提案と一緒に保存できるため、作成元を簡単に検証でき、ドラフトの信頼性を維持できます。
パイプラインを自動化して提案の一定ストリームを維持 : MongoDBを使用すると、毎日のジョブをスケジュールしてニュースのスクレイピング、埋め込みの処理、最新のトピック推奨を保証する提案を生成できます。
作成者
Aswin Subramanian Mahaswalan、 MongoDB
Felipe Trejos, MongoDB
詳細
Atlas ベクトル検索 がセマンティック検索を強化し、リアルタイム分析を可能にする方法については、Atlas ベクトル検索ページ をご覧ください。
MongoDB がメディア操作をどのように変換しているかについては、「 AI経由でのメディアのパーソナライズ: MongoDBとベクトル検索 」に関する記事をお読みください。
MongoDB が最新のメディアワークフローをどのようにサポートしているかを確認するには、MongoDB for メディアとエンタープライズ ページをご覧ください。