Você pode configurar o MongoDB Vector Search para gerar e gerenciar automaticamente incorporações vetoriais para os dados de texto em seu cluster Atlas . Quando você ativa a Incorporação automatizada, o MongoDB Vector Search gera automaticamente incorporações usando o modelo de incorporação da Voyage AI especificado no momento do índice para o campo de texto especificado em sua collection e no momento da query para a cadeia de texto em sua query.
A incorporação automatizada simplifica o processo de criação de pesquisas semânticas. Você não precisa gerar, armazenar ou gerenciar incorporações vetoriais por conta própria. O Atlas lida com a geração de incorporação, atualizações e query nativamente.
Observação
Você deve habilitar o auto-scaling com um tamanho máximo de instância de M30 ou superior para clusters M10 e M20 para usar a Incorporação automatizada. Para todas as outras camadas do cluster, a Incorporação Automática está habilitada por padrão.
Você pode implantar o MongoDB Vector Search e ativar a pesquisa semântica inteligente com IA em seus dados de texto por meio da Incorporação automatizada nos índices do MongoDB Vector Search. As funcionalidades de incorporação automatizada do MongoDB transformam o processo tradicionalmente complexo de implementação de pesquisa vetorial em uma solução de etapa única. Em vez de gerenciar a infraestrutura de incorporação, a seleção de modelo e o código de integração separados, agora você pode implementar a pesquisa semântica por meio de uma simples configuração de campo .
Quando você configura índices do MongoDB Vector Search, ele gera automaticamente incorporações vetoriais para dados de texto em sua coleção, usando sua seleção de um modelo de incorporação Voyage AI de última geração, mantém as incorporações em sincronização à medida que seus dados são alterados e também suporta uso de queries de texto em linguagem natural. Essas incorporações vetoriais capturam relacionamentos significativos em seus dados e permitem a pesquisa com base em intenção, em vez de palavras-chave.
Habilitar e usar a incorporação automatizada
Para habilitar a incorporação automatizada, crie um índice do MongoDB Vector Search usando o tipo autoEmbed . O tipo de autoEmbed especifica o campo para o qual você deseja habilitar a Incorporação Automática e o modelo de incorporação que deseja utilizar. Você também pode incluir um ou mais campos para pré-filtrar seus dados usando o tipo filter.
1 { 2 "fields": [ 3 { 4 "type": "autoEmbed", 5 "modality": "text", 6 "path": "<field-to-index>", 7 "model": "<embedding-model>" 8 }, 9 { 10 "type": "filter", 11 "path": "<field-to-index>" 12 }, 13 ... 14 ] 15 }
Para saber mais sobre a sintaxe e os campos do índice, consulte Como indexar campos para o Vector Search.
A Vector Search do MongoDB gera automaticamente incorporações para documentos novos e existentes que você insere ou atualiza.
Depois de criar o índice, você pode executar suas queries. O MongoDB Vector Search gera automaticamente incorporações para seu texto de query usando o mesmo modelo de incorporação especificado no índice. Opcionalmente, você pode especificar um modelo de incorporação diferente usando a model opção no $vectorSearch estágio de pipeline, mas o modelo de incorporação especificado deve ser compatível com o modelo de incorporação usado no momento do índice.
1 [ 2 { 3 "$vectorSearch": { 4 "index": "<index-name>", 5 "path": "<field-to-index>", 6 "query": "<query-text>", 7 "model": "<embedding-model>" 8 } 9 }, 10 { 11 "$project": { 12 "_id": 0, 13 "<field-to-index>": 1, 14 "score": { "$meta": "vectorSearchScore" } 15 } 16 } 17 ]
Para saber mais, consulte Executar queries de pesquisa vetorial.
Observação
O recurso está disponível para implantações do MongoDB Search e do MongoDB Vector Search usando Docker, tarball ou um gerenciador de pacote e para implantações usando o MongoDB Drivers for Kubernetes Operator com o MongoDB 8.2 ou posterior Community Edition. A funcionalidade de incorporação automatizada ainda não está disponível para o MongoDB Enterprise Edition.
Com uma alteração simples de configuração, você pode ativar a pesquisa semântica, o RAG e a memória para os agentes de IA sem escrever código de incorporação, gerenciar a infraestrutura do modelo ou lidar com pipelines vetoriais. Ou seja, ao implantar o MongoDB Community Edition com o processo do MongoDB Search e Vector Search,, mongot você pode fornecer as chaves da API do Voyage AI para usar na geração de incorporações, de preferência uma para operações de indexação e outra para operações de query de diferentes projetos.
Após a implantação:
Na sua coleção, escolha o campo de texto para o qual deseja habilitar a pesquisa semântica.
Na lista de modelos de incorporação disponíveis, escolha um modelo de incorporação.
Em sua definição de índice do MongoDB Vector Search, configure a Incorporação automatizada usando o tipo
autoEmbed.
Para saber mais sobre como configurar o índice do MongoDB Vector Search para incorporação automatizada, consulte Como indexar campos para o Vector Search.
MongoDB Vector Search gera automaticamente incorporações para documentos novos e existentes que você insere ou atualiza usando aschaves de API do que você especificou ao inicializar o MongoDB Community Edition.
Para query, use a query.text opção no $vectorSearch estágio de pipeline. O MongoDB Vector Search gera incorporações para a query de texto usando o mesmo modelo de incorporação na definição do índice. Você pode especificar um modelo de incorporação diferente usando a model opção no $vectorSearch estágio de pipeline, mas o modelo de incorporação especificado deve ser compatível com o modelo de incorporação usado no momento do índice. A Vector Search do MongoDB usa a chave de API de query que você forneceu durante a inicialização da MongoDB Community para gerar as incorporações no momento da query. Para saber mais, consulte Executar queries de Vector Search .
Você incorre em cobranças por gerar incorporações usando as chaves de API. Para saber mais, consulte Gerenciar faturamento.
Para automatizar incorporações e executar uma consulta de amostra, consulte Início rápido da Vector Search do MongoDB .
Chaves de API do Voyage AI
Embora seja possível usar uma única chave de API para gerar incorporações no momento do índice e no momento da query, recomendamos que você use chaves de API separadas para evitar que as operações de query afetem negativamente as operações de indexação.
Você pode gerar chaves de API das seguintes maneiras:
(Recomendado) Usando sua conta do Atlas, que permite que você gerencie sua chave de API do modelo de incorporação do Voyage AI a partir da UI do Atlas.
Para saber mais sobre como gerar e gerenciar chaves de API, incluindo a configuração dos limites de taxa (que é uma combinação de TPM e RPM) e o monitoramento do uso da chave de API, consulte Modelo de chaves de API.
Para saber mais sobre como gerenciar as chaves API criadas a partir da Voyage AI, consulte Chave API.
Após criar as chaves, você deve especificar as chaves que deseja utilizar para incorporação automatizada ao configurar o mongot durante a implantação com MongoDB Community Edition. O MongoDB Vector Search usa a chave de API do Voyage IA que você forneceu durante a implantação do mongot para gerar automaticamente incorporações para seus dados no índice e para seu texto de query no momento da query.
Armazenamento de incorporações
Índices de incorporação automatizados geram incorporações vetoriais de forma assíncrona e persistem no cluster MongoDB em um banco de dados de reserva separado . Cada índice de Incorporação Automatizada tem exatamente uma Coleção de Incorporações gerada correspondente. A coleção de incorporações gerada é armazenada em um banco de dados interno dedicado no mesmo cluster.
Para saber mais, consulte Coleção de incorporações geradas.
Modelos disponíveis
O MongoDB Vector Search se integra aos modelos de incorporação de última geração da Voyage IA, cada um otimizado para casos de uso específicos:
Modelo de incorporação | Descrição | Preço por 1M de tokens |
|---|---|---|
| Otimizado para aplicativos de alto volume e sensíveis ao custo. | $0.02 |
| (Recomendado) Desempenho balanceado para pesquisa geral de texto. | $0.06 |
| Máxima precisão para relacionamentos semânticos complexos. | $0.12 |
| Especificamente para pesquisa de código e documentação técnica. | $0.18 |
Para saber mais, consulte Modelos para incorporação automatizada.
Conceitos chave
- modelo de incorporação
Os modelos de incorporação são algoritmos que convertem dados em incorporações vetoriais que capturam o significado semântica ou subjacente dos dados. Estes vetores habilitam a pesquisa vetorial.
Para saber mais sobre os modelos de incorporação para incorporação automatizada, consulte Modelos disponíveis.
- incorporações de vetor
Uma incorporação de vetor é uma array de números, com cada dimensão representando uma funcionalidade ou atributo diferente de seus dados. Os vetores podem ser usados para representar qualquer tipo de dados, de texto, imagens e vídeo a dados não estruturados. Você cria incorporações vetoriais passando seus dados por um modelo de incorporação e pode armazenar essas incorporações em um banco de dados que oferece suporte a incorporações vetoriais, como o MongoDB.
Para saber mais sobre o armazenamento de incorporações para incorporação automatizada, consulte Coleção de incorporações gerada.
- tokens
No contexto de modelos incorporados e LLMs, os tokens são as unidades fundamentais de texto, como palavras, subpalavras ou caracteres, que o modelo processa para criar incorporações ou gerar texto. Os tokens são como você é cobrado pelo uso de modelos de incorporação e LLMs.
Para saber mais sobre tokens para incorporação automatizada, consulte Gerenciar cobrança para incorporação automatizada.
- limites de taxa
Os limites de taxa são restrições impostas pelos fornecedores de API sobre o número de solicitações que um usuário pode fazer dentro de um período de tempo específico, geralmente medido em tokens por minuto (TPM) ou solicitações por minuto (RPM). Esses limites garantem o uso leal, evitam violações e mantêm a estabilidade e o desempenho do serviço para todos os usuários.
Para saber mais sobre os limites de taxa de incorporação automatizada, consulte Limites de taxa.
- quantização
A quantização reduz a precisão das incorporações vetoriais para diminuir o uso de memória e armazenamento, com desvantagens na precisão da pesquisa. Para incorporação automática, o MongoDB Vector Search suporta os seguintes tipos de quantização:
Tipo de QuantizaçãoDescriçãofloatArmazena as incorporações vetoriais como valores flutuantes de 32bits.
scalarReduz cada dimensão vetorial de 32bits float para 8bits inteiros.
binaryReduz cada dimensão vetorial para um único bit e redefine os principais resultados.
binaryNoRescoreReduz cada dimensão vetorial para um único bit sem reclassificar.
Para saber mais sobre a quantização da incorporação automatizada, consulte Sobre a quantização.
- número de dimensões
O número de dimensões especifica o comprimento do vetor de incorporação para cada documento ( quantos números estão na array ). Dimensões maiores capturam mais detalhes semânticas e, em geral, melhoram a precisão da recuperação, mas aumentam os custos de armazenamento e computação (tamanho do índice, uso de RAM e, às vezes, latência).
Para saber mais,
numCandidatesconsulte Seleção.- semelhança
A função de similaridade é utilizada para medir a similaridade entre dois vetores ou a proximidade de um vetor de query dos vetores no índice. O MongoDB Vector Search oferece suporte às seguintes funções de similaridade:
cosine- mede a similaridade com base no ângulo entre os vetores.dotProduct- mede a similaridade comocosine, mas leva em conta a magnitude do vetor. Recomendamos esta função de similaridade para fidelidade total ou quantizaçãoscalar.euclidean- mede a distância entre as extremidades dos vetores. Recomendamos esta função de similaridade para quantizaçãobinaryoubinaryNoRescore, onde os vetores são compactados e a distância no espaço Hamming ou Euclideano é o sinal correto.
Para saber mais sobre as funções de similaridade da Incorporação Automática, consulte Sobre as funções de similaridade.