对于 AI 代理:可在 https://www.mongodb.com/zh-cn/docs/llms.txt 获取文档索引—通过在任何 URL 路径后添加 .md 可获取所有页面的 Markdown 版本。
Docs 菜单

管理原生重新排名

重要

原生重新排名是作为一项预览功能提供的。在预览期间,功能和相应的文档可能随时更改。因此,我们不建议在生产环境中使用此功能。目前,我们不会使用此功能中的任何客户数据来训练我们的模型。要学习;了解更多信息,请参阅预览功能。

您可以在Atlas用户界面中执行以下任务:

要启用或禁用原生重排名,您必须拥有该项目的Project Owner 访问权限。如果您具有Organization Owner 访问权限,则必须将自己添加为Project Owner 项目才能启用或禁用原生重排名。

要查看速率限制和使用指标,您必须对该项目具有Project Read OnlyProject Search Index Editor 或更高级别的访问权限。

在使用 $rerank 阶段之前,您必须为项目启用Native Reranking。

要启用或禁用重新排名,请完成以下步骤:

1
  1. 如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含所需项目的组织。

  2. 如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。

  3. 在侧边栏中,单击 图标 Project Overview 旁边的图标。

显示项目设置页面。

2

要启用重新排名,请执行以下操作:

  1. Project Settings标签页中,将 Native Reranking: $rerank in the Aggregation Pipeline 开关设立为 On

  2. Confirm Rerank Model Usage窗口中,选中复选框以确认您了解与使用 $rerank 阶段相关的成本,然后单击 Confirm

要禁用重新排名,请完成以下步骤:

  1. Project Settings标签页中,将 Native Reranking: $rerank in the Aggregation Pipeline 开关设立为 Off

  2. Disable Native Reranking 确认窗口中,键入 Disable 并单击 Disable

    禁用重新排名可能会导致使用 $rerank 阶段的查询运行失败。

您可以在组织级别配置资源策略,以完全区块或例外情况下阻止$rerank 。为此,添加一条用forbid Cedar 编写的针对$rerank 动作的 规则。如果配置此策略,新项目将无法启用$rerank 。但是,该策略不会禁用已启用$rerank 的项目。您必须为每个已启用$rerank 的项目单独禁用 。要为项目禁用$rerank ,请参阅启用或禁用原生重排名。

您可以通过使用 forbid 规则中的 unless 子句来禁用 $rerank(例外情况)。

示例:禁用 $rerank,但有例外
forbid (principal, action == ResourcePolicy::Action::"$rerank", resource) unless { <exception> };

要学习;了解有关设置资源策略的更多信息,请参阅Atlas资源策略。

在Atlas 用户界面 的Usage 页面监控令牌使用情况。要查看使用情况:

1

您可以从 Search & Vector Search 选项或 Data Explorer go 到 MongoDB搜索页面。

  1. 如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含项目的组织。

  2. 如果尚未显示,请从导航栏的 Projects 菜单中选择您的项目。

  3. 在侧边栏中,单击 Database 标题下的 Search & Vector Search

  4. 如果您的项目有多个集群,请从 Select cluster 下拉列表中选择要使用的集群,然后单击 Go to Atlas Search

    显示“搜索和向量搜索”页面。

  1. 如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含项目的组织。

  2. 如果尚未显示,请从导航栏的 Projects 菜单中选择您的项目。

  3. 在侧边栏中,单击 Database 标题下的 Data Explorer

  4. 展开数据库并选择集合。

  5. 单击该集合的 Indexes 标签页。

  6. 单击横幅中的 Search and Vector Search 链接。

    显示“搜索和向量搜索”页面。

Atlas 用户界面中的 Rate Limits 页面提供项目的速率限制以及如何提高速率指导。

Atlas对您在特定时间范围内可以发出的请求数量实施速率限制,以每分钟令牌 (TPM) 或每分钟请求数 (RPM) 来衡量。速率限制采用分层系统,层级越高,限制越多。

模型
每分钟请求数 (RPM)
每分钟令牌数 (TPM)

rerank-2.5

4 , 000

4,000,000

rerank-2.5-lite

4 , 000

8,000,000

rerank-2

4 , 000

4,000,000

rerank-2-lite

4 , 000

8,000,000

1

您可以从 Search & Vector Search 选项或 Data Explorer go 到 MongoDB搜索页面。

  1. 如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含项目的组织。

  2. 如果尚未显示,请从导航栏的 Projects 菜单中选择您的项目。

  3. 在侧边栏中,单击 Database 标题下的 Search & Vector Search

  4. 如果您的项目有多个集群,请从 Select cluster 下拉列表中选择要使用的集群,然后单击 Go to Atlas Search

    显示“搜索和向量搜索”页面。

  1. 如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含项目的组织。

  2. 如果尚未显示,请从导航栏的 Projects 菜单中选择您的项目。

  3. 在侧边栏中,单击 Database 标题下的 Data Explorer

  4. 展开数据库并选择集合。

  5. 单击该集合的 Indexes 标签页。

  6. 单击横幅中的 Search and Vector Search 链接。

    显示“搜索和向量搜索”页面。

2

随着使用量的增加, MongoDB会自动提高速率限制。如果仍需要更高的速率限制,联系MongoDB支持部门。

您可以通过Atlas用户界面中的以下指标监控$rerank 的使用情况:

衡量标准
说明
$rerank Query Status Rate

成功完成的 $rerank 查询的百分比。使用此指标来识别 $rerank 查询中的故障,例如速率限制错误或 Voyage AI的连接问题。

$rerank Token Usage Rate

$rerank 查询使用的令牌总数。使用此指标监控令牌消耗并将使用量与计费关联起来。

要查看 $rerank 使用情况的指标:

1
  1. 从导航栏的“组织”菜单中选择包含您的项目的组织。

  2. 从导航栏的 Projects(项目)菜单中选择项目。

  3. 在侧边栏中,单击 Database 标题下的 Clusters

  4. 单击集群的名称以打开 Cluster 侧边栏。

  5. 单击 Cluster 侧栏中的 Metrics

2

您可以通过单击相应的指标来查看 $rerank Query Status Rate$rerank Token Usage Rate指标。