对于 AI 代理:可在 https://www.mongodb.com/zh-cn/docs/llms.txt 获取文档索引—通过在任何 URL 路径后添加 .md 可获取所有页面的 Markdown 版本。
Docs 菜单

MongoDB 向量搜索 架构

MongoDB Vector Searchmongot 通过在MongoDB 数据库部署() 的同时部署 进程,在Kubernetes环境中启用AI驱动的语义搜索功能。mongod mongot进程管理向量索引,从数据库获取数据,并处理$vectorSearch 查询。这样一来,在提供高级搜索功能的同时,就无需保持不同的系统同步。

要部署Vector Search,请应用MongoDBSearch 自定义资源 (CR), Kubernetes Operator 会拾取并使用该资源来部署mongot Pod 并请求在 spec 中指定的持久存储。

有关部署过程,请参阅部署MongoDB Search 和 Vector Search。

每个 mongot进程都有自己的持久卷,不与数据库或其他搜索节点共享。存储用于维护向量索引,而向量索引是根据持续源自数据库的数据构建的。索引定义(元数据)存储在数据库中。

mongot 执行以下操作:

  • 管理向量索引。

    mongot 负责更新数据库中的索引定义。

  • 从数据库中获取数据。

    mongot 节点与数据库建立永久连接,以便实时更新数据库中的索引。

  • 处理向量搜索查询。

    mongod 收到$vectorSearch 查询时,它会将查询定向到mongot 节点之一。接收查询的mongot 处理查询,聚合数据,并将结果返回给mongod ,后者将结果转发给用户。

mongot 组件与单个MongoDB副本集紧密耦合,不能在多个数据库或副本集之间共享。每个副本集部署都有自己的专用搜索节点。

mongotmongod 之间的网络连接是双向的:

  • mongot 建立与副本集的连接,以获取用于构建索引和运行查询的数据。

  • mongod 连接到 mongot 以转发与搜索相关的操作,例如索引管理和查询数据。

mongod 充当所有搜索查询的代理。您从不直接与 mongot交互。

mongotmongod 进程同时部署在Kubernetes集群内时, Kubernetes Operator 会自动为这两个进程执行配置。具体来说, Kubernetes Operator:

  1. 使用 查找 MongoDBSearch 引用的MongoDB CR,或根据命名约定查找与spec.source.mongodbResourceRef MongoDBSearch 同名的MongoDB CR。

  2. YAML 文件中生成 mongot 配置,并将其保存到名为 <MongoDBSearch.metadata.name>-search-config 的配置映射中。

  3. 部署名为 的 Vector Search<MongoDBSearch.metadata.name>-search 有状态设立,并根据spec.persistence spec.resourceRequirementsCR 中的 和 配置存储和资源要求。

  4. 通过添加必要的 setParameter 选项(包括 mongot 主机的主机名和端口号)来更新每个 mongod进程的配置。

当MongoDB副本集位于Kubernetes外部时,您可以使用Kubernetes Operator部署mongot 并手动执行一些步骤。 Kubernetes Operator 会处理搜索Pod 的配置,但您必须重新配置MongoDB节点和网络。

如果MongoDB服务器位于Kubernetes集群内,则Kubernetes Operator 会自动为 Vector Search 设置密钥文件身份验证。如果MongoDB服务器位于外部,则必须创建一个包含副本集密钥文件档案的Kubernetes密钥,并在 MongoDBSearch CR 中引用它。

您无法在以下架构上部署Vector Search:

  • IBM Power (ppc64le)

  • IBM Z (s390x)

提示