Docs 菜单
Docs 主页
/
Atlas
/ /

Atlas Search Playground 中的 Chatbot Demo Builder

使用 RAG 聊天机器人在MongoDB Search Playground 中快速试用MongoDB Vector Search,该聊天机器人通过向量搜索回答有关数据的问题。 MongoDB Search Playground 中的 聊天机器人演示构建器允许您引入自己的数据,尝试不同的分块策略,使用 Voyage AI嵌入模型生成嵌入,以及在没有Atlas帐户、集群或集合的情况下提出有关数据的问题。您还可以与其他人股票MongoDB Search Playground快照的链接。

Chatbot Demo Builder 使用两个聚合管道阶段, $vectorSearch$project

这是一个生成式 AI 聊天机器人。所有信息在使用前都应经过验证。请勿上传敏感数据。MongoDB 日志记录您的工作负载数据,以监控系统健康状况并帮助解决 Chatbot Demo Builder 中的任何问题。

  • Chatbot Demo Builder 将导入的 PDF 文件或复制粘贴的文本作为单一、统一的知识源进行处理。您无法在构建器中定义或组合独立的数据集合。

  • Chatbot Demo Builder 使用一个不可编辑的预配置向量搜索索引。查询根据指定的检索设置生成,不能使用代码编辑器直接编辑。

  • Chatbot Demo Builder 环境不会持续存在。要保存环境,请使用 Share 按钮生成可持续 30 天的快照 URL

  • Chatbot Demo Builder 仅支持基于文本的嵌入。如果您的 PDF 文件包含图像,聊天机器人将无法处理或回答关于这些图像内容的问题。

  • Chatbot Demo Builder 具有以下数据限制:

    • 无法导入大于 100 MB 的文件。

    • 总字符数不能超过 100,000 个字符。

    • 您不能为嵌入解决方案带来自己的向量嵌入或 API 凭证。

1

导航到“聊天机器人演示生成器”<https://search-playground.mongodb.com/tools/chatbot-demo-builder/.

2

Chatbot Demo Builder 提供三种数据源选项。

Upload PDF

从本地设备上传 PDF 文件,最大为 100 MB。如果字符数超过 100,000,您必须仅使用前 100,000 个字符或上传字符较少的文件。您可以使用 SEE TEXT 预览文本。

Copy & Paste Text

复制并粘贴文本,最多 100,000 个字符。如果字符数超过 100,000,您必须仅使用前 100,000 个字符或减小文本大小。

Sample Data

使用 MongoDB 提供的示例数据,这是一份关于虚构公园的 PDF。

Chatbot Demo Builder 是一个公开演示。请勿上传敏感数据。

3

自定义数据块设置和嵌入模型。

Chunking strategy

选择 Recursive Chunking(默认选项)或 Fixed Token Count with Overlap

Chunk size

定义每个数据块的令牌数量。令牌数量必须至少是数据块重叠量的两倍。

  • Minimum: 40 tokens

  • 最大值:1500 个令牌

Chunk overlap

指定相邻数据块之间标记重叠部分的大小。重叠大小最多只能是数据块大小的一半。

  • Minimum: 0 tokens

  • 最大值:750 个令牌

Embedding model

请选择以下嵌入模型之一:

  • voyage-3-large(默认选项)

  • voyage-finance-2

  • voyage-law-2

要在创建嵌入后修改这些选项,请使用侧边栏 DATA SETTINGS。更改设置会清除先前的聊天记录。

4

每个问题和回答对都是独立的,不依赖于之前的交互。选择 Share时,Playground 会保存数据配置和检索设置。问答历史记录既不能保存,也不能共享。

对于您提出的每个问题,Chatbot Demo Builder 将显示以下设置:

设置或输出
页面位置
说明

Search Query

聊天框中链接答案

查看MongoDB Vector Search查询语法。

[number] DOCUMENTS

聊天框中链接答案

查看通过运行搜索查询检索到的文档,以及结果的评分方式。

Data to Evaluate (numCandidates)

右侧面板

调整系统审核的潜在匹配数量,以选择最佳结果。要详尽地搜索所有索引矢量嵌入,请勾选 Evaluate all [number] documents (ENN) 复选框。这可能会影响查询延迟。

Data to Retrieve (limit)

右侧面板

调整返回的文档(数据块)数量。

Data Source

Bottom panel tab

将您的数据视为 MongoDB DocumentsFull Extracted Text

Index Definition

Bottom panel tab

查看生成的MongoDB Vector Search索引定义。

Search Query

Bottom panel tab

查看用于最新问题和回答的MongoDB Vector Search查询语法。

LLM & Prompt

Bottom panel tab

查看所使用的大型语言模型 (LLM)。

5

使用 Share 按钮生成一个可保留 30 天的快照 URL

使用 Get Code 按钮访问 GitHub 存储库,其中提供了关于如何自行构建类似聊天机器人的入门代码。

注意

Chatbot Demo Builder 的性能可能与生产性能不同。

要学习;了解有关向量搜索查询的更多信息,请参阅运行向量搜索查询。要学习;了解有关检索增强生成 (RAG) 的更多信息,请参阅使用MongoDB检索增强生成 (RAG)

后退

检索增强生成 (RAG)

在此页面上