O Voyage AI fornece modelos de incorporação e reclassificação de última geração. A API deincorporação e reclassificação do MongoDB fornece acesso aos modelos mais recentes da Voyage AI. Esta página descreve os modelos disponíveis e quando usá-los.
O que são modelos de incorporação e rerankers?
Para incorporações de texto, recomendamos:
voyage-4-largepara a melhor qualidadevoyage-4-litepela menor latência e custovoyage-4para um equilíbrio entre qualidade e desempenhoUm modelo específico de domínio se seu aplicativo estiver em um dos domínios listados.
Para outros casos de uso, recomendamos:
voyage-multimodal-3.5para incorporações de texto, imagem e vídeovoyage-context-3para tarefas de recuperação em nível de parte e em nível de documentorerank-2.5para adicionar reclassificação à maioria dos aplicativosrerank-2.5-litepara adicionar reclassificação de aplicativos sensíveis à latência
Incorporações de texto
O Voyage IA fornece os seguintes modelos de incorporação de texto para capturar o significado semântico do texto.
Para obter detalhes e exemplo de uso, consulte Incorporações de texto.
Modelos de uso geral
Use os modelos a seguir para a maioria dos aplicativos de pesquisa e recuperação de IA.
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | A melhor qualidade de recuperação para uso geral e multilíngue. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog. |
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Otimizado para qualidade de recuperação de uso geral e multilíngue. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog. |
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Otimizado para latência e custo. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog. |
Modelos específicos de domínio
Use os seguintes modelos para domínios especializados para obter maior precisão.
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Otimizado para recuperação e documentação de código. Para saber mais, consulte a publicação no blog. |
| 32,000 tokens | 1024 | Otimizado para recuperação de crédito e aplicativos RAG. Para saber mais, consulte a publicação no blog. |
| 16,000 tokens | 1024 | Otimizado para recuperação legal e aplicativos RAG. Para saber mais, consulte a publicação no blog. |
Modelos abertos
A Voyage também fornece os seguintes modelos de peso aberto.
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 512 (padrão), 128, 256 | Modelo de peso aberto disponível no Abraçando Face. Todas as incorporações criadas com a série 4 são compatíveis entre si Para saber mais, consulte a publicação no blog. |
Os modelos mais recentes têm desempenho melhor do que os modelos legado em todos os aspectos, como qualidade, duração do contexto, latência e taxa de transferência.
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Geração anterior de incorporações de texto para qualidade de recuperação multilíngue e de uso geral. Para saber mais, consulte a publicação no blog. |
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Geração anterior de incorporações de texto otimizadas para qualidade de recuperação multilíngue e de uso geral. Para saber mais, consulte a publicação no blog. |
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Geração anterior de incorporações de texto otimizadas para latência e custo. Para saber mais, consulte a publicação no blog. |
| 16,000 tokens | 1536 | Otimizado para recuperação de código (17% melhor que as alternativas). Geração anterior de incorporações de código. Para saber mais, consulte a publicação no blog. |
Embeddings de partes contextualizadas
A Voyage IA fornece os seguintes modelos que geram incorporações enquanto incorporam o contexto circundante para melhorar a precisão da recuperação.
Para obter detalhes e exemplo de uso, consulte Incorporações contextuais de partes.
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Incorporações de partes contextualizadas otimizadas para qualidade de recuperação multilíngue e de uso geral. Para aprender mais, consulte a publicação no blog. |
Incorporações multimodais
O Voyage IA fornece os seguintes modelos de incorporação que processam texto, imagens e vídeo.
Para obter detalhes e exemplo de uso, consulte Incorporações multimodais.
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Modelo de incorporação multimodal avançado que pode vetorizar texto intercalado e dados visuais, como capturas de tela de PDFs, diapositivas, tabelas, imagens, vídeos e muito mais. Para saber mais, consulte a publicação no blog. |
Os modelos mais recentes têm desempenho melhor do que os modelos legado em todos os aspectos, como qualidade, duração do contexto, latência e taxa de transferência.
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 | Processa texto e imagens em incorporações unificadas. Suporta imagens de 50,000 a 2 milhões de pixels. Para saber mais, consulte a publicação no blog. |
Rerankers
A Voyage AI fornece os seguintes modelos de reclassificação para refinar seus resultados de pesquisa.
Para obter detalhes e exemplo de uso, consulte Rerankers.
Modelo | Comprimento do contexto | Descrição |
|---|---|---|
| 32,000 | A mais alta precisão. Recomendado para a maioria dos aplicativos. Para saber mais, consulte a publicação no blog. |
| 32,000 | Modelo rápido e econômico otimizado para aplicativos sensíveis à latência. Para saber mais, consulte a publicação no blog. |
Os modelos mais recentes têm desempenho melhor do que os modelos legado em todos os aspectos, como qualidade, duração do contexto, latência e taxa de transferência.
Modelo | Comprimento do contexto | Descrição |
|---|---|---|
| 16,000 tokens | Nosso reclassificador de segunda geração generalista otimizado para qualidade com suporte multilíngue. Para saber mais, consulte a publicação no blog. |
| 8,000 tokens | Nosso reclassificador de segunda geração generalista otimizado para latência e qualidade com suporte multilíngue. Para saber mais, consulte a publicação no blog. |
Preços
O preço do modelo é baseado no uso, com cobranças cobradas na conta do Atlas vinculada à chave de API usada para acesso. Todos os modelos incluem uma camada grátis. Comece com 200 milhões de tokens gratuitos para a maioria dos modelos ou 50 milhões de tokens para modelos especializados.
O preço é baseado no número de tokens em seus documentos e queries. A camada grátis inclui 200 milhões de tokens para a maioria dos modelos e 50 milhões de tokens para os seguintes modelos especializados: voyage-finance-2, voyage-law-2, voyage-code-2.
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens grátis |
|---|---|---|---|
| $0.00012 | $0.12 | 200 milhões |
| $0.00006 | $0.06 | 200 milhões |
| $0.00002 | $0.02 | 200 milhões |
| $0.00018 | $0.18 | 200 milhões |
| $0.00018 | $0.18 | 200 milhões |
voyage-finance-2voyage-law-2voyage-code-2 | $0.00012 | $0.12 | 50 milhões |
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens grátis |
|---|---|---|---|
| $0.00018 | $0.18 | 0 |
| $0.00006 | $0.06 | 0 |
| $0.00002 | $0.02 | 0 |
O preço é baseado no número de tokens em seus documentos e queries.
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens grátis |
|---|---|---|---|
| $0.00018 | $0.18 | 200 milhões |
O preço é baseado em tokens de texto e pixels de imagem. A camada grátis inclui 200 milhões de tokens de texto e 150 bilhões de pixels para modelos multimodais. As imagens são processadas entre 50,000 pixels (mínimo) e 2 milhões de pixels (máximo), com custos que ficam na faixa de $0.00003 a $0.0012 por imagem. Para fins de preços, cada framework de vídeo é considerado uma imagem.
Observação
Imagens com menos de 50,000 pixels são redimensionadas, processadas e cobradas como uma imagem de 50,000bits. Imagens contendo mais de 2 milhões de pixels são reduzidas e cobradas como imagens de 2 milhões de bits.
Modelo | Price per 1M tokens | Price per 1B pixels | camada grátis |
|---|---|---|---|
| $0.12 | $0.60 | 200M tokens, 150B pixels |
Resolução da imagem | Número de pixels | Preço por imagem | Price per 1K images |
|---|---|---|---|
200px × 200px | 40,000 | $0.00003 | $0.03 |
1000px × 1000px | 1 milhões | $0.0006 | $0.60 |
2000px × 2000px | 4 milhões | $0.0012 | $1.20 |
4000px × 4000px | 16 milhões | $0.0012 | $1.20 |
Exemplo
O custo para vetorizar uma única entrada com 1,000 tokens de texto (US$0.00012) e duas imagens de 4 milhões de bits (2 × $0.0012) seriam de $0.00252.
O preço é baseado no total de tokens processados, calculado como (query tokens × number of documents) + sum of tokens in all documents. A camada grátis inclui 200 milhão de tokens para os modelos de reclassificação mais recentes.
Modelo | Price per 1K tokens | Price per 1M tokens | Est. price per request* | Tokens grátis |
|---|---|---|---|---|
| $0.00005 | $0.05 | $0.0025 | 200 milhões |
| $0.00002 | $0.02 | $0.001 | 200 milhões |
* O preço estimado pressupõe 100 documentos por solicitação, com a soma de tokens de consulta e tokens por documento totalizando 500.