Importante
A reclassificação nativa está disponível como um recurso de visualização. O recurso e a documentação correspondente podem mudar a qualquer momento durante o período de Pré-visualização. Portanto, não recomendamos usar esse recurso em ambientes de produção. No momento, não usamos nenhum dado de cliente desse recurso para treinar nossos modelos. Para saber mais, consulte Visualizar recursos.
Você pode executar as seguintes tarefas na IU do Atlas:
Habilite ou desabilite a reclassificação nativa para todos os projetos em sua organização ou por projeto.
Visualize os limites de taxa.
Permissões necessárias
Para ativar ou desativar a reclassificação nativa, você deve ter Project Owner acesso ao projeto. Se você tiver acesso, deverá se adicionar Organization Owner como Project Owner ao projeto para ativar ou desativar a reclassificação nativa.
Para visualizar os limites de taxa e as métricas de uso, você deve ter Project Read Only acesso ou ou superior ao projeto.Project Search Index Editor
Habilitar ou desabilitar a reclassificação nativa para um projeto
Antes de usar o estágio $rerank, você deve ativar a reclassificação nativa para seu projeto.
Ativar ou desativar a reclassificação nativa
Para habilitar ou desabilitar a reclassificação, complete as seguintes etapas:
No Atlas, vá para a página Project Settings.
Se ainda não tiver sido exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.
Se ainda não estiver exibido, selecione o projeto desejado no menu Projects na barra de navegação.
Na barra lateral, clique no ícone ao lado de Project Overview.
A página Configurações do projeto é exibida.
Habilite ou desabilite a reclassificação.
Para habilitar a reclassificação, faça o seguinte:
Na aba Project Settings, defina a alternância de Native Reranking: $rerank in the Aggregation Pipeline para On.
Na janela Confirm Rerank Model Usage, marque a caixa de seleção para confirmar que você entende os custos associados ao uso do estágio
$reranke clique em Confirm.
Para desativar a reclassificação, conclua as seguintes etapas:
Na aba Project Settings, defina a alternância de Native Reranking: $rerank in the Aggregation Pipeline para Off.
Na janela de confirmação Disable Native Reranking, digite
Disablee clique em Disable.A desativação da reclassificação pode fazer com que a execução de queries que usam o estágio
$rerankfalhe.
Restringir a reclassificação nativa usando uma política de recursos
Você pode configurar uma política de recursos no nível da organização para bloquear $rerank totalmente ou com exceções. Para fazer isso, adicione uma forbid regra escrita no Cedar que tenha como alvo a $rerank ação . Se você configurar esta política, novos projetos não poderão habilitar $rerank o. No entanto, a política não desabilita projetos que já tenham $rerank habilitado. Você deve desabilitar $rerank individualmente para cada projeto que já o tenha habilitado. Para desabilitar o $rerank para um projeto, consulte Habilitar ou desabilitar a reclassificação nativa.
Você pode desabilitar $rerank com exceções usando a cláusula unless na regra forbid.
forbid (principal, action == ResourcePolicy::Action::"$rerank", resource) unless { <exception> };
Para saber mais sobre como configurar a política de recursos, consulte Políticas de Recursos do Atlas.
Monitore o uso de token
Monitore seu uso do token na página Usage na IU do Atlas. Para visualizar o uso:
In Atlas, vá para a página Search & Vector Search para seu cluster.
Você pode acessar a página de pesquisa do MongoDB a partir da opção Search & Vector Search ou do Data Explorer.
Se ainda não tiver sido exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.
Se ainda não estiver exibido, selecione seu projeto no menu Projects na barra de navegação.
Na barra lateral, clique em Search & Vector Search sob o título Database.
Se o seu projeto tiver vários clusters, selecione o cluster que deseja usar no menu suspenso Select cluster e clique em Go to Atlas Search.
A página Pesquisa & Pesquisa Vetorial é exibida.
Se ainda não tiver sido exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.
Se ainda não estiver exibido, selecione seu projeto no menu Projects na barra de navegação.
Na barra lateral, clique em Data Explorer sob o título Database.
Expanda o banco de dados e selecione a coleção.
Clique na guia Indexes da coleção.
Clique no link Search and Vector Search no banner.
A página Pesquisa & Pesquisa Vetorial é exibida.
Clique em Usage em Native Reranking na barra de navegação.
A Usage página fornece várias visualizações para monitorar e analisar seu uso de token. Para saber mais, consulte Uso de token.
Gerenciar limites de taxa
A página Rate Limits na interface do usuário do Atlas fornece os limites de taxa para seu projeto e orientação sobre como aumentá-los.
Níveis de uso e limites de taxa
O Atlas impõe limites de taxa ao número de solicitações que você pode fazer dentro de um período de tempo específico, medido em tokens por minuto (TPM) ou solicitações por minuto (RPM). Os limites de taxa seguem um sistema em camadas, com níveis mais altos oferecendo limites maiores.
Modelo | Solicitações por minuto (RPM) | Tokens por minuto (TPM) |
|---|---|---|
| 4,000 | 4,000,000 |
| 4,000 | 8,000,000 |
| 4,000 | 4,000,000 |
| 4,000 | 8,000,000 |
Visualizar limites de taxa
In Atlas, vá para a página Search & Vector Search para seu cluster.
Você pode acessar a página de pesquisa do MongoDB a partir da opção Search & Vector Search ou do Data Explorer.
Se ainda não tiver sido exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.
Se ainda não estiver exibido, selecione seu projeto no menu Projects na barra de navegação.
Na barra lateral, clique em Search & Vector Search sob o título Database.
Se o seu projeto tiver vários clusters, selecione o cluster que deseja usar no menu suspenso Select cluster e clique em Go to Atlas Search.
A página Pesquisa & Pesquisa Vetorial é exibida.
Se ainda não tiver sido exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.
Se ainda não estiver exibido, selecione seu projeto no menu Projects na barra de navegação.
Na barra lateral, clique em Data Explorer sob o título Database.
Expanda o banco de dados e selecione a coleção.
Clique na guia Indexes da coleção.
Clique no link Search and Vector Search no banner.
A página Pesquisa & Pesquisa Vetorial é exibida.
Aumentar limites de taxa
O MongoDB aumenta automaticamente os limites de taxa à medida que seu uso aumenta. Se você ainda precisar de um limite de taxa maior, entre em contato com o Suporte do MongoDB .
Monitore métricas para reclassificação de nativos
Você pode monitorar o uso do $rerank por meio das seguintes métricas na interface do usuário do Atlas :
Métrica | Descrição |
|---|---|
$rerank Query Status Rate | A porcentagem de |
$rerank Token Usage Rate | O número total de tokens que as queries |
Para visualizar as métricas do uso do $rerank:
Navegue até a Metrics guia para seu cluster.
Selecione a organização que contém seu projeto no menu Organizações na barra de navegação.
Selecione seu projeto no menu Projects na barra de navegação.
Na barra lateral, clique em Clusters sob o título Database.
Clique no nome do cluster para abrir a barra lateral Cluster.
Clique em Metrics na barra lateral Cluster.