行业:媒体、电信
产品和工具: MongoDB Atlas,MongoDB Atlas Vector Search
合作伙伴: Amazon Bedrock
解决方案概述
在快节奏的新闻环境中,内容团队面临着越来越大的压力,要制作引人入胜且可信的内容。由于在手动研究、源验证和工具管理上花费了时间,传统方法往往会导致创意疲劳和错失机会,而不是内容创建。借助MongoDB,您可以将生成式AI与 MongoDB 的自适应数据基础架构相结合,以优化编辑操作。为了帮助您测试这些功能,我们为您提供了内容实验室演示,这是一个您可以复制的解决方案。
内容实验室演示简化了编辑工作流程,并允许您:
摄取和结构化不同的内容:该演示有效地处理来自各种来源的大量非结构化和半结构化内容,并按主题、行业和源元元数据对其进行动态组织。
支持AI驱动的发现和起草:嵌入模型和MongoDB Atlas Vector Search 将原始内容转换为结构化的可搜索数据。这种组合支持对热门主题进行语义检索并自动起草内容,从而减少创意疲劳。
提高内容可信度:该演示捕获并存储源 URL,然后将其直接嵌入到主题建议中。与外部搜索代理的集成进一步丰富了带有上下文信息的内容建议。
促进个性化并提高工作流程效率:该演示处理用户的个人资料以提供个性化的写作建议并存储草稿以进行版本控制和重复使用。MongoDB 灵活的模式可以在不中断工作流程的情况下轻松适应不断发展的配置文件数据、草稿格式和新的内容类型,从而使这一切成为可能。
图 1。用户旅程流程图
通过提供统一存储解决方案、实时见解和自动化内容辅助,该演示展示了MongoDB如何帮助编辑团队降低复杂性、提高内容质量并加快制作速度。它为出版商提供了从创意到出版的清晰路径。
参考架构
内容实验室演示提供了一个AI驱动的发布工具,该工具将 Gen AI与 MongoDB灵活数据基础架构相结合,以简化编辑操作。该架构设计为微服务,旨在:
处理多样化的内容摄取
推动AI支持的发现和起草工作
提高内容可信度
支持个性化和工作流程效率
图 2。内容实验室演示的高级架构
此架构使用以下组件:
用户界面 (用户界面 ):用户通过用户界面与系统交互,该 UI 提供主题建议、起草工具和草稿管理等功能。
后端服务:这些微服务处理演示的不同功能,包括:
内容分析和建议后端:该服务处理新闻和 Reddit 数据,通过 Cohere-embed 等嵌入模型将内容转换为语义向量。然后可以使用Atlas Vector Search处理这些向量,以提供实时主题建议。该微服务具有以下主要组件:
调度程序和编排:该服务每天自动执行摄取、嵌入生成和主题建议工作流程。
角色:该服务使用语义搜索和检索为下游写作辅助和写作助手微服务提供个性化支持。
下面是该微服务的高级概述图。
点击放大图 3。内容和建议后端的高级架构
写作助手后端:该服务提供发布工具,包括草稿大纲、校对、内容优化和聊天完成。这些工具使用 法学硕士,例如通过Amazon Web Services Bedrock 的 Anthropic Claude。
MongoDB Atlas: Atlas用主节点 (primary node in the replica set)数据存储,提供语义搜索功能、数据库存储和聚合管道,以实现高效处理和检索。
数据模型方法
此演示使用以下文档模型设计和集合来存储内容。
内容实验室演示中有五个主要集合:
userProfile
reddit_posts
news
suggestions
drafts
userProfile
集合会存储各个用户的偏好,以定制由AI驱动的个性化建议。这些偏好包括:
persona
:用户可以选择的写入器类型。tone
:用户可以选择所需的语气,示例休闲、正式或半正式。styleTraits
:作者的预定义特征。sampleText
:作者的示例。
此模式遵循MongoDB设计原则,即经常访问的数据存储在一起,使写作助手能够快速检索用户推荐。示例文档如下所示。
{ "_id": { "$oid": "6862a8988c0f7bf43af995a8" }, "persona": "The Formal Expert", "userName": "Mark S.", "tone": "Polished, academic, appeals to professionals and older readers", "styleTraits": [ "Long, structured paragraphs", "Formal language with rich vocabulary", "Analytical, often includes references or citations" ], "sampleText": "This development represents..." }
reddit_posts
和 news
集合存储从各自 API 摄取的原始数据。这些文档通过嵌入进一步丰富,嵌入是启用语义搜索的内容含义的数字表示。
suggestions
集合包含根据已处理的 reddit_posts
和 news
数据建议的主题。用户界面可以轻松找到这些文档,并使用它们进行主题选择。示例文档如下所示。
{ "_id": { "$oid": "686fb23055303796c4f37b7e" }, "topic": "Backlash against generative AI", "keywords": [ "algorithmic bias", "data privacy", "AI regulation", "public trust" ], "description": "As generative AI tools like ChatGPT proliferate, a growing public backlash highlights concerns over their negative impacts and the need for stronger oversight.", "label": "technology", "url": "https://www.wired.com/story/generative-ai-backlash/", "type": "news_analysis", "analyzed_at": { "$date": "2025-07-10T12:29:36.277Z" }, "source_query": "Viral social media content" }
最后,drafts
集合存储用户的草稿。每个草稿都与一个建议的主题相关联,以便于组织和检索。此模型可确保编辑工作流程的持久性、版本控制和内容可重用性。
构建解决方案
您可以按照以下步骤复制此演示:
预配MongoDB Atlas
在您的MongoDB Atlas帐户中,使用以下集合创建一个集群和一个名为 contentlab
的数据库:
drafts
:存储用户创建的草稿文档news
:使用嵌入存储抓取的新闻文章。reddit_posts
:使用嵌入存储 Reddit 帖子和评论。suggestions
:存储AI生成的主题建议。userProfiles
:存储用户配置文件信息和偏好。
安装依赖项并运行服务
在端口8000 和8001 上安装并启动这两项后端服务。然后,安装前端依赖项并在 http://localhost:3000 启动开发服务器。
关键要点
利用 MongoDB 灵活的模式调整数据模型:借助MongoDB,您可以在集合中无缝添加新字段或调整现有字段,例如自定义元数据、摘要和版本历史记录,而无需停机或复杂的迁移。
集成Atlas Vector Search以实现有意义的发现:借助MongoDB,您可以将来自各种 API 的嵌入存储在各自的集合中,然后运行相似度查询以在几秒钟内发现相关主题。
通过跟踪内容来源确保编辑信任:使用MongoDB ,您可以将源 URL 和元数据与建议一起存储,从而轻松验证来源并保持草稿的可信度。
通过自动化管道来保持流的创意:借助MongoDB,您可以安排日常作业以抓取新闻、进程嵌入并生成保证提供最新主题推荐的建议。
作者
Aswin Subramanian Maheswaran, MongoDB
Felipe Trejos, MongoDB
了解详情
要了解Atlas Vector Search如何支持语义搜索并实现实时分析,请访问Atlas Vector Search页面。
要学习;了解MongoDB如何改变媒体运营,请阅读《 AI支持的媒体个性化: MongoDB和 Vector Search》一文。
要了解MongoDB如何支持现代媒体工作流程,请访问MongoDB媒体和娱乐页面。