O MongoDB fornece uma API para os melhores modelos de incorporação e reclassificação da classe do Voyage AI. Use os modelos de IA Voyage com outras partes de sua pilha de IA, incluindo bancos de dados vetoriais e modelos de linguagem grandes (LLMs), para criar aplicativos prontos para produção com pesquisa e recuperação precisas de IA.

Comece a construir
Use os seguintes recursos para começar:
Crie uma chave de API, gere suas primeiras incorporações e crie um aplicação RAG.
Saiba como gerenciar suas chaves de API no MongoDB Atlas.
Explore a especificação da API.
Modelos de IA de viagem
Os modelos de incorporação e reclassificação da Voyage AI são de última geração em precisão de recuperação. Para saber mais sobre os modelos, consulte Visão geral dos modelos.
viagem-4-large
A melhor qualidade de recuperação para uso geral e multilíngue. Todos os modelos da série 4 compartilham o mesmo espaço de incorporação.
viagem-contexto-3
Incorporações de chunks contextualizadas otimizadas para qualidade de recuperação multilíngue e de uso geral.
viagem-multimodal-3.5
Modelo de incorporação multimodal avançado que pode vetorizar texto intercalado e dados visuais, como capturas de tela de PDFs, diapositivas, tabelas, imagens, vídeos e muito mais.
rerank-2.5
Nosso reclassificador generalista otimizado para qualidade com suporte multilíngue e acompanhamento de instruções.
Casos de uso
Os modelos de IA Voyage são compatíveis com os seguintes casos de uso:
Use a pesquisa semântica para recuperar informações contextualmente relevantes.
Implemente o RAG para ancorar LLMs em seus dados e reduzir as atordoamentos.
Melhor Juntos
Aproveite o Voyage AI com o MongoDB Vector Search e integrações de IA para simplificar o desenvolvimento de aplicação de IA.
Combine os modelos de IA do Voyage com o MongoDB Vector Search para criar aplicativos de IA prontos para a produção.
Integração com LangChain, LlamaIndex e outras estruturas populares de IA.
Conceitos chave
- modelo de incorporação
- Os modelos de incorporação são algoritmos que convertem dados em incorporações vetoriais que capturam o significado semântica ou subjacente dos dados. Esses vetores permitem a pesquisa vetorial e servem como blocos de construção essenciais para a geração aumentada de recuperação (RAG), a abordagem predominante para a criação de aplicativos de IA confiáveis.
- reranker
- Rerankers são algoritmos que pontuam a relevância entre uma query de pesquisa e seus resultados de pesquisa. Os reclassificadores ajudam a refinar os resultados iniciais reordenando documentos com base em pontuações de relevância, gerando um subconjunto de resultados mais preciso.
- incorporações de vetor
- Uma incorporação de vetor é uma array de números, com cada dimensão representando uma funcionalidade ou atributo diferente de seus dados. Os vetores podem ser usados para representar qualquer tipo de dados, de texto, imagens e vídeo a dados não estruturados. Você cria incorporações vetoriais passando seus dados por um modelo de incorporação e pode armazenar essas incorporações em um banco de dados que oferece suporte a incorporações vetoriais, como o MongoDB.
- Pesquisa vetorial
- A pesquisa vetorial é o método de pesquisa que alimenta a pesquisa semântica e o RAG. Ao medir a distância entre vetores, você pode determinar a similaridade semântica entre diferentes pontos de dados. Isso permite que você obtenha resultados de pesquisa relevantes comparando sua query vetorizada com suas incorporações vetoriais. Você pode usar os modelos Voyage AI com qualquer solução de pesquisa vetorial e banco de dados vetorial, mas eles se integram perfeitamente ao MongoDB Vector Search e ao MongoDB Atlas.
- RAG
- A geração aumentada de recuperação (RAG) é uma arquitetura usada para aumentar modelos de linguagem grandes (LLMs) com dados adicionais para que eles possam gerar respostas mais precisas. Para saber mais, consulte RAG com Voyage AI.
- tokens
- No contexto de modelos incorporados e LLMs, os tokens são as unidades fundamentais de texto, como palavras, subpalavras ou caracteres, que o modelo processa para criar incorporações ou gerar texto. Os tokens são como você é cobrado pelo uso de modelos de incorporação e LLMs.
- limites de taxa
- Os limites de taxa são restrições impostas pelos fornecedores de API sobre o número de solicitações que um usuário pode fazer dentro de um período de tempo específico, geralmente medido em tokens por minuto (TPM) ou solicitações por minuto (RPM). Esses limites garantem o uso leal, evitam violações e mantêm a estabilidade e o desempenho do serviço para todos os usuários.