重要
您可以在Atlas用户界面中执行以下任务:
所需权限
要启用或禁用原生重排名,您必须拥有该项目的Project Owner 访问权限。如果您具有Organization Owner 访问权限,则必须将自己添加为Project Owner 项目才能启用或禁用原生重排名。
要查看速率限制和使用指标,您必须对该项目具有Project Read Only 或Project Search Index Editor 或更高级别的访问权限。
启用或禁用项目的原生重新排名
在使用 $rerank 阶段之前,您必须为项目启用Native Reranking。
启用或禁用原生重新排名
要启用或禁用重新排名,请完成以下步骤:
在Atlas中,转到 Project Settings 页面。
如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含所需项目的组织。
如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。
在侧边栏中,单击 图标 Project Overview 旁边的图标。
显示项目设置页面。
启用或禁用重新排名。
要启用重新排名,请执行以下操作:
在 Project Settings标签页中,将 Native Reranking: $rerank in the Aggregation Pipeline 开关设立为 On。
在 Confirm Rerank Model Usage窗口中,选中复选框以确认您了解与使用
$rerank阶段相关的成本,然后单击 Confirm。
要禁用重新排名,请完成以下步骤:
在 Project Settings标签页中,将 Native Reranking: $rerank in the Aggregation Pipeline 开关设立为 Off。
在 Disable Native Reranking 确认窗口中,键入
Disable并单击 Disable。禁用重新排名可能会导致使用
$rerank阶段的查询运行失败。
使用资源策略限制原生重新排名
您可以在组织级别配置资源策略,以完全区块或例外情况下阻止$rerank 。为此,添加一条用forbid Cedar 编写的针对$rerank 动作的 规则。如果配置此策略,新项目将无法启用$rerank 。但是,该策略不会禁用已启用$rerank 的项目。您必须为每个已启用$rerank 的项目单独禁用 。要为项目禁用$rerank ,请参阅启用或禁用原生重排名。
您可以通过使用 forbid 规则中的 unless 子句来禁用 $rerank(例外情况)。
forbid (principal, action == ResourcePolicy::Action::"$rerank", resource) unless { <exception> };
要学习;了解有关设置资源策略的更多信息,请参阅Atlas资源策略。
监控令牌使用情况
在Atlas 用户界面 的Usage 页面监控令牌使用情况。要查看使用情况:
管理速率限制
Atlas 用户界面中的 Rate Limits 页面提供项目的速率限制以及如何提高速率指导。
使用层级和速率限制
Atlas对您在特定时间范围内可以发出的请求数量实施速率限制,以每分钟令牌 (TPM) 或每分钟请求数 (RPM) 来衡量。速率限制采用分层系统,层级越高,限制越多。
模型 | 每分钟请求数 (RPM) | 每分钟令牌数 (TPM) |
|---|---|---|
| 4 , 000 | 4,000,000 |
| 4 , 000 | 8,000,000 |
| 4 , 000 | 4,000,000 |
| 4 , 000 | 8,000,000 |
查看速率限制
提高速率限制
监控原生重新排名指标
您可以通过Atlas用户界面中的以下指标监控$rerank 的使用情况:
衡量标准 | 说明 |
|---|---|
$rerank Query Status Rate | 成功完成的 |
$rerank Token Usage Rate |
|
要查看 $rerank 使用情况的指标: