Menu Docs
Página inicial do Docs
/ /

Como gerar automaticamente incorporações vetoriais para dados de texto em sua coleção e consultas

Você pode implantar o MongoDB Vector Search e habilitar a pesquisa semântica inteligente e alimentada por IA em seus dados de texto por meio da incorporação automatizada nos índices do MongoDB Vector Search . Os recursos de incorporação automatizada do MongoDB transformam o processo dinamicamente complexo de implementação de pesquisa vetorial em uma solução de etapa única. Em vez de gerenciar a infraestrutura de incorporação, a seleção de modelo e o código de integração separados, agora você pode implementar a pesquisa semântica por meio de uma simples configuração de campo .

Quando você configura índices do MongoDB Vector Search , ele gera automaticamente incorporações vetoriais para dados de texto em sua coleção, usando sua seleção de um modelo de incorporação Voyage AI de última geração, mantém as incorporações sincronizadas à medida que seus dados são alterados e também suporta uso de queries de texto em linguagem natural. Essas incorporações vetoriais capturam relacionamentos significativos em seus dados e permitem a pesquisa com base em intenção, em vez de palavras-chave.

Com uma alteração simples de configuração, você pode ativar a pesquisa semântica, o RAG e a memória para os agentes de IA sem escrever código de incorporação, gerenciar a infraestrutura do modelo ou lidar com pipelines vetoriais. Ou seja, ao implantar o MongoDB Community Edition com o processo do MongoDB Search e Vector Search,, mongot você pode fornecer as chaves da API Voyage AI a serem usadas para gerar incorporações, idealmente uma para operações de indexação e outra para operações de query de projetos diferentes.

Após a implantação:

  1. Na sua coleção, escolha o campo de texto para o qual deseja habilitar a pesquisa semântica.

  2. Na lista de modelos de incorporação disponíveis, escolha um modelo de incorporação.

  3. Em sua definição de índice do MongoDB Vector Search , configure incorporações automatizadas utilizando o tipo autoEmbed.

Para saber mais sobre como configurar o índice do MongoDB Vector Search para incorporação automatizada, consulte Indexar um campo de texto.

A Vector Search do MongoDB gera automaticamente incorporações para documentos novos e existentes que você insere ou atualiza usando as chaves de API do que você especificou ao inicializar o MongoDB Community Edition.

Observação

As incorporações geradas são armazenadas em uma coleção de sistema separada no mesmo cluster.

Para query, use a query.text opção no $vectorSearch estágio de pipeline. O MongoDB Vector Search gera incorporações para a query de texto usando o mesmo modelo de incorporação na definição do índice. Você pode especificar um modelo de incorporação diferente usando a model opção no $vectorSearch estágio de pipeline, mas o modelo de incorporação especificado deve ser compatível com o modelo de incorporação usado no momento do índice. A Vector Search do MongoDB usa a chave de API de query que você forneceu durante a inicialização da MongoDB Community para gerar as incorporações no momento da query. Para saber mais, consulte Executar uma query de texto.

Você incorrerá em cobranças por gerar incorporações usando as chaves de API. Para saber mais, consulte Custos.

Para automatizar incorporações e executar uma consulta de amostra, consulte Introdução.

Embora seja possível usar uma única chave de API para gerar incorporações no momento do índice e no momento da query, recomendamos que você use chaves de API separadas para evitar que as operações de query afetem negativamente as operações de indexação.

Você pode gerar chaves de API das seguintes maneiras:

Após criar as chaves, você deve especificar as chaves que deseja utilizar para incorporação automatizada ao configurar mongot o durante o sistema com MongoDB Community Edition. O MongoDB Vector Search usa a chave de API do Voyage AI que você forneceu durante a implantação do mongot para gerar automaticamente incorporações para seus dados no índice e para seu texto de query no momento da query.

O MongoDB Vector Search se integra aos modelos de incorporação de última geração da Voyage AI, cada um otimizado para casos de uso específicos:

Modelo de incorporação
Descrição

voyage-4-lite

Otimizado para aplicativos de alto volume e sensíveis ao custo.

voyage-4

(Recomendado) Desempenho balanceado para pesquisa geral de texto.

voyage-4-large

Máxima precisão para relações semânticas complexas.

voyage-code-3

Especificamente para pesquisa de código e documentação técnica.

Os preços do modelo de incorporação são baseados no uso, com cobranças cobradas na conta vinculada à chave de API usada para acesso. O preço é baseado no número de tokens em seu campo de texto e queries.

Observação

No contexto de modelos incorporados e LLMs, os tokens são as unidades fundamentais de texto, como palavras, subpalavras ou caracteres, que o modelo processa para criar incorporações ou gerar texto. Os tokens são como você é cobrado pelo uso de modelos de incorporação e LLMs.

Se você usar a chave de API criada usando sua conta do Atlas , poderá monitorar o uso da chave de API a partir da UI do Atlas . Para saber mais, consulte Faturamento.

Se você gerou a chave de API diretamente da Voyage AI, consulte Preços para saber mais sobre a cobrança das solicitações para o endpoint de serviço de incorporação.

Enquanto estiver na Pré-visualização, a funcionalidade de incorporação automatizada ainda não está disponível para os seguintes tipos de sistema:

  • Atlas clusters

  • Sistemas locais do Atlas usando a Atlas CLI

  • MongoDB Enterprise Edition

O recurso só está disponível para sistemas MongoDB Search e MongoDB Vector Search usando Docker, tarball ou um gerenciador de pacote e para sistemas usando o MongoDB Controladores para Kubernetes Operator com MongoDB 8.2 ou posterior Community Edition.

Use o tutorial a seguir para saber como configurar o MongoDB Vector Search para gerar automaticamente incorporações vetoriais. Especificamente, você executa as seguintes ações:

  1. Indexe o campo ou campos em sua coleção que contêm dados de texto para os quais você deseja gerar automaticamente incorporações no momento do índice.

  2. Execute uma query de texto nos campos indexados usando incorporações geradas automaticamente no momento da query.

Este tutorial utiliza o namespace sample_airbnb.listingsAndReviews para demonstrar como indexar um campo de texto ,, summary na coleção para gerar automaticamente incorporações no momento do índice e executar uma consulta de texto no campo indexadosummary,, utilizando incorporações geradas em query-time.

Para concluir este tutorial, você deve ter o seguinte:

A definição de índice que você cria neste tutorial indexa os seguintes campos na coleção sample_airbnb.listingsAndReviews:

  • summary campo como o tipo autoEmbed para gerar automaticamente incorporações para os dados de texto no campo utilizando o modelo de incorporação voyage-4.

  • address.country campo como o tipo filter para pré-filtrar os dados para a pesquisa semântica usando o valor da string no campo.

  • bedroom campo como o tipo filter para pré-filtrar os dados para a pesquisa semântica utilizando o valor numérico no campo.

Para criar este índice:

A consulta neste tutorial faz o seguinte:

  1. Executado em summary campo indexado na coleção sample_airbnb.listingsAndReviews.

  2. Pré-filtra as propriedades usando os seguintes critérios:

    • Propriedades que têm 3 ou mais bedrooms.

    • Propriedades no country denominado United States.

  3. Executa uma pesquisa semântica para propriedades que são close to amusement parks utilizando as incorporações geradas automaticamente com o modelo de incorporação do voyage-4. A query:

    • Considera até 100 vizinhos mais próximos.

    • Limita os resultados a 10 documentos.

Para executar esta query:

Voltar

Compatibilidade e limitações

Receber um selo de habilidade

Domine "RAG com MongoDB" gratuitamente!

Saiba mais

Nesta página