使用 RAG 聊天机器人在MongoDB Search Playground 中快速试用MongoDB Vector Search,该聊天机器人通过向量搜索回答有关数据的问题。 MongoDB Search Playground 中的 聊天机器人演示构建器允许您引入自己的数据,尝试不同的分块策略,使用 Voyage AI嵌入模型生成嵌入,以及在没有Atlas帐户、集群或集合的情况下提出有关数据的问题。您还可以与其他人股票MongoDB Search Playground快照的链接。
使用的阶段
Chatbot Demo Builder 使用两个聚合管道阶段, $vectorSearch
和 $project
。
Considerations
这是一个生成式 AI 聊天机器人。所有信息在使用前都应经过验证。请勿上传敏感数据。MongoDB 日志记录您的工作负载数据,以监控系统健康状况并帮助解决 Chatbot Demo Builder 中的任何问题。
Chatbot Demo Builder 限制
Chatbot Demo Builder 将导入的 PDF 文件或复制粘贴的文本作为单一、统一的知识源进行处理。您无法在构建器中定义或组合独立的数据集合。
Chatbot Demo Builder 使用一个不可编辑的预配置向量搜索索引。查询根据指定的检索设置生成,不能使用代码编辑器直接编辑。
Chatbot Demo Builder 环境不会持续存在。要保存环境,请使用 Share 按钮生成可持续 30 天的快照 URL。
Chatbot Demo Builder 仅支持基于文本的嵌入。如果您的 PDF 文件包含图像,聊天机器人将无法处理或回答关于这些图像内容的问题。
Chatbot Demo Builder 具有以下数据限制:
无法导入大于 100 MB 的文件。
总字符数不能超过 100,000 个字符。
您不能为嵌入解决方案带来自己的向量嵌入或 API 凭证。
试用 Chatbot Demo Builder
访问 Chatbot Demo Builder。
导航到“聊天机器人演示生成器”<https://search-playground.mongodb.com/tools/chatbot-demo-builder/.
请选择您的数据源。
Chatbot Demo Builder 提供三种数据源选项。
Upload PDF | 从本地设备上传 PDF 文件,最大为 100 MB。如果字符数超过 100,000,您必须仅使用前 100,000 个字符或上传字符较少的文件。您可以使用 SEE TEXT 预览文本。 |
Copy & Paste Text | 复制并粘贴文本,最多 100,000 个字符。如果字符数超过 100,000,您必须仅使用前 100,000 个字符或减小文本大小。 |
Sample Data | 使用 MongoDB 提供的示例数据,这是一份关于虚构公园的 PDF。 |
Chatbot Demo Builder 是一个公开演示。请勿上传敏感数据。
配置数据处理。
自定义数据块设置和嵌入模型。
Chunking strategy | 选择 Recursive Chunking(默认选项)或 Fixed Token Count with Overlap。 |
Chunk size | 定义每个数据块的令牌数量。令牌数量必须至少是数据块重叠量的两倍。
|
Chunk overlap | 指定相邻数据块之间标记重叠部分的大小。重叠大小最多只能是数据块大小的一半。
|
Embedding model | 请选择以下嵌入模型之一:
|
要在创建嵌入后修改这些选项,请使用侧边栏 DATA SETTINGS。更改设置会清除先前的聊天记录。
询问有关数据的问题并编辑检索设置。
每个问题和回答对都是独立的,不依赖于之前的交互。选择 Share时,Playground 会保存数据配置和检索设置。问答历史记录既不能保存,也不能共享。
对于您提出的每个问题,Chatbot Demo Builder 将显示以下设置:
设置或输出 | 页面位置 | 说明 |
---|---|---|
Search Query | 聊天框中链接答案 | 查看MongoDB Vector Search查询语法。 |
[number] DOCUMENTS | 聊天框中链接答案 | 查看通过运行搜索查询检索到的文档,以及结果的评分方式。 |
Data to Evaluate (numCandidates) | 右侧面板 | 调整系统审核的潜在匹配数量,以选择最佳结果。要详尽地搜索所有索引矢量嵌入,请勾选 Evaluate all [number] documents (ENN) 复选框。这可能会影响查询延迟。 |
Data to Retrieve (limit) | 右侧面板 | 调整返回的文档(数据块)数量。 |
Data Source | Bottom panel tab | 将您的数据视为 MongoDB Documents 或 Full Extracted Text。 |
Index Definition | Bottom panel tab | 查看生成的MongoDB Vector Search索引定义。 |
Search Query | Bottom panel tab | 查看用于最新问题和回答的MongoDB Vector Search查询语法。 |
LLM & Prompt | Bottom panel tab | 查看所使用的大型语言模型 (LLM)。 |
注意
Chatbot Demo Builder 的性能可能与生产性能不同。
了解详情
要学习;了解有关向量搜索查询的更多信息,请参阅运行向量搜索查询。要学习;了解有关检索增强生成 (RAG) 的更多信息,请参阅使用MongoDB检索增强生成 (RAG)。