Você pode implantar o MongoDB Vector Search e habilitar a pesquisa semântica inteligente e alimentada por IA em seus dados de texto por meio da incorporação automatizada nos índices do MongoDB Vector Search . Os recursos de incorporação automatizada do MongoDB transformam o processo dinamicamente complexo de implementação de pesquisa vetorial em uma solução de etapa única. Em vez de gerenciar a infraestrutura de incorporação, a seleção de modelo e o código de integração separados, agora você pode implementar a pesquisa semântica por meio de uma simples configuração de campo .
Quando você configura índices do MongoDB Vector Search , ele gera automaticamente incorporações vetoriais para dados de texto em sua coleção, usando sua seleção de um modelo de incorporação Voyage AI de última geração, mantém as incorporações sincronizadas à medida que seus dados são alterados e também suporta uso de queries de texto em linguagem natural. Essas incorporações vetoriais capturam relacionamentos significativos em seus dados e permitem a pesquisa com base em intenção, em vez de palavras-chave.
Visão geral
Com uma alteração simples de configuração, você pode ativar a pesquisa semântica, o RAG e a memória para os agentes de IA sem escrever código de incorporação, gerenciar a infraestrutura do modelo ou lidar com pipelines vetoriais. Ou seja, ao implantar o MongoDB Community Edition com o processo do MongoDB Search e Vector Search,, mongot você pode fornecer as chaves da API Voyage AI a serem usadas para gerar incorporações, idealmente uma para operações de indexação e outra para operações de query de projetos diferentes.
Após a implantação:
Na sua coleção, escolha o campo de texto para o qual deseja habilitar a pesquisa semântica.
Na lista de modelos de incorporação disponíveis, escolha um modelo de incorporação.
Em sua definição de índice do MongoDB Vector Search , configure incorporações automatizadas utilizando o tipo
autoEmbed.
Para saber mais sobre como configurar o índice do MongoDB Vector Search para incorporação automatizada, consulte Indexar um campo de texto.
A Vector Search do MongoDB gera automaticamente incorporações para documentos novos e existentes que você insere ou atualiza usando as chaves de API do que você especificou ao inicializar o MongoDB Community Edition.
Observação
As incorporações geradas são armazenadas em uma coleção de sistema separada no mesmo cluster.
Para query, use a query.text opção no $vectorSearch estágio de pipeline. O MongoDB Vector Search gera incorporações para a query de texto usando o mesmo modelo de incorporação na definição do índice. Você pode especificar um modelo de incorporação diferente usando a model opção no $vectorSearch estágio de pipeline, mas o modelo de incorporação especificado deve ser compatível com o modelo de incorporação usado no momento do índice. A Vector Search do MongoDB usa a chave de API de query que você forneceu durante a inicialização da MongoDB Community para gerar as incorporações no momento da query. Para saber mais, consulte Executar uma query de texto.
Você incorrerá em cobranças por gerar incorporações usando as chaves de API. Para saber mais, consulte Custos.
Para automatizar incorporações e executar uma consulta de amostra, consulte Introdução.
Chaves de API do Voyage AI
Embora seja possível usar uma única chave de API para gerar incorporações no momento do índice e no momento da query, recomendamos que você use chaves de API separadas para evitar que as operações de query afetem negativamente as operações de indexação.
Você pode gerar chaves de API das seguintes maneiras:
(Recomendado) Usando sua conta do Atlas , que permite que você gerencie sua chave de API do modelo de incorporação do Voyage AI a partir da UI do Atlas .
Para saber mais sobre como gerar e gerenciar chaves de API, incluindo a configuração dos limites de taxa (que é uma combinação de TPM e RPM) e o monitoramento do uso da chave de API, consulte Modelo de chaves de API.
Para saber mais sobre como gerenciar as chaves API criadas a partir da Voyage AI, consulte Chave API.
Após criar as chaves, você deve especificar as chaves que deseja utilizar para incorporação automatizada ao configurar mongot o durante o sistema com MongoDB Community Edition. O MongoDB Vector Search usa a chave de API do Voyage AI que você forneceu durante a implantação do mongot para gerar automaticamente incorporações para seus dados no índice e para seu texto de query no momento da query.
Modelos de incorporação suportados
O MongoDB Vector Search se integra aos modelos de incorporação de última geração da Voyage AI, cada um otimizado para casos de uso específicos:
Modelo de incorporação | Descrição |
|---|---|
| Otimizado para aplicativos de alto volume e sensíveis ao custo. |
| (Recomendado) Desempenho balanceado para pesquisa geral de texto. |
| Máxima precisão para relações semânticas complexas. |
| Especificamente para pesquisa de código e documentação técnica. |
custos
Os preços do modelo de incorporação são baseados no uso, com cobranças cobradas na conta vinculada à chave de API usada para acesso. O preço é baseado no número de tokens em seu campo de texto e queries.
Observação
No contexto de modelos incorporados e LLMs, os tokens são as unidades fundamentais de texto, como palavras, subpalavras ou caracteres, que o modelo processa para criar incorporações ou gerar texto. Os tokens são como você é cobrado pelo uso de modelos de incorporação e LLMs.
Se você usar a chave de API criada usando sua conta do Atlas , poderá monitorar o uso da chave de API a partir da UI do Atlas . Para saber mais, consulte Faturamento.
Se você gerou a chave de API diretamente da Voyage AI, consulte Preços para saber mais sobre a cobrança das solicitações para o endpoint de serviço de incorporação.
Limitações
Enquanto estiver na Pré-visualização, a funcionalidade de incorporação automatizada ainda não está disponível para os seguintes tipos de sistema:
Atlas clusters
Sistemas locais do Atlas usando a Atlas CLI
MongoDB Enterprise Edition
O recurso só está disponível para sistemas MongoDB Search e MongoDB Vector Search usando Docker, tarball ou um gerenciador de pacote e para sistemas usando o MongoDB Controladores para Kubernetes Operator com MongoDB 8.2 ou posterior Community Edition.
Começar
Use o tutorial a seguir para saber como configurar o MongoDB Vector Search para gerar automaticamente incorporações vetoriais. Especificamente, você executa as seguintes ações:
Indexe o campo ou campos em sua coleção que contêm dados de texto para os quais você deseja gerar automaticamente incorporações no momento do índice.
Execute uma query de texto nos campos indexados usando incorporações geradas automaticamente no momento da query.
Este tutorial utiliza o namespace sample_airbnb.listingsAndReviews para demonstrar como indexar um campo de texto ,, summary na coleção para gerar automaticamente incorporações no momento do índice e executar uma consulta de texto no campo indexadosummary,, utilizando incorporações geradas em query-time.
Pré-requisitos
Para concluir este tutorial, você deve ter o seguinte:
Sistema autogerenciado do MongoDB v8.2 ou posterior Community Edition com MongoDB Search e MongoDB Vector Search
Para saber mais,consulte Instalar o MongoDB Community Edition.
Chave ou chaves válidas da API Voyage AI
Para saber mais, consulte Chaves de API do Voyage AI.
Indexar um campo de texto
A definição de índice que você cria neste tutorial indexa os seguintes campos na coleção sample_airbnb.listingsAndReviews:
summarycampo como o tipoautoEmbedpara gerar automaticamente incorporações para os dados de texto no campo utilizando o modelo de incorporaçãovoyage-4.address.countrycampo como o tipofilterpara pré-filtrar os dados para a pesquisa semântica usando o valor da string no campo.bedroomcampo como o tipofilterpara pré-filtrar os dados para a pesquisa semântica utilizando o valor numérico no campo.
Para criar este índice:
Executar uma query de texto
A consulta neste tutorial faz o seguinte:
Executado em
summarycampo indexado na coleçãosample_airbnb.listingsAndReviews.Pré-filtra as propriedades usando os seguintes critérios:
Propriedades que têm
3ou maisbedrooms.Propriedades no
countrydenominadoUnited States.
Executa uma pesquisa semântica para propriedades que são
close to amusement parksutilizando as incorporações geradas automaticamente com o modelo de incorporação dovoyage-4. A query:Considera até
100vizinhos mais próximos.Limita os resultados a
10documentos.
Para executar esta query: