Visão geral dos modelos

A API de incorporação e reclassificação está na visualização. O recurso e a documentação correspondente podem mudar a qualquer momento durante o período de pré-visualização.

O Voyage AI fornece modelos de incorporação e reclassificação de última geração. A API deincorporação e reclassificação do MongoDB fornece acesso aos modelos mais recentes da Voyage AI. Esta página descreve os modelos disponíveis e quando usá-los.

O que são modelos de incorporação e rerankers?

Escolher um modelo

Expanda esta seção para aprender mais sobre qual modelo escolher para seu caso de uso.

Para incorporações de texto, recomendamos:

voyage-4-large para a melhor qualidade
voyage-4-lite pela menor latência e custo
voyage-4 para um equilíbrio entre qualidade e desempenho
Um modelo específico de domínio se seu aplicativo estiver em um dos domínios listados.

Para outros casos de uso, recomendamos:

voyage-multimodal-3.5 para incorporações de texto, imagem e vídeo
voyage-context-3 para tarefas de recuperação em nível de parte e em nível de documento
rerank-2.5 para adicionar reclassificação à maioria dos aplicativos
rerank-2.5-lite para adicionar reclassificação de aplicativos sensíveis à latência

Incorporações de texto

O Voyage IA fornece os seguintes modelos de incorporação de texto para capturar o significado semântico do texto.

Para obter detalhes e exemplo de uso, consulte Incorporações de texto.

Modelos de uso geral

Use os modelos a seguir para a maioria dos aplicativos de pesquisa e recuperação de IA.

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-4-large`	32,000 tokens	1024 (padrão), 256, 512, 2048	A melhor qualidade de recuperação para uso geral e multilíngue. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog.
`voyage-4`	32,000 tokens	1024 (padrão), 256, 512, 2048	Otimizado para qualidade de recuperação de uso geral e multilíngue. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog.
`voyage-4-lite`	32,000 tokens	1024 (padrão), 256, 512, 2048	Otimizado para latência e custo. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog.

Modelos específicos de domínio

Use os seguintes modelos para domínios especializados para obter maior precisão.

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-code-3`	32,000 tokens	1024 (padrão), 256, 512, 2048	Otimizado para recuperação e documentação de código. Para saber mais, consulte a publicação no blog.
`voyage-finance-2`	32,000 tokens	1024	Otimizado para recuperação de crédito e aplicativos RAG. Para saber mais, consulte a publicação no blog.
`voyage-law-2`	16,000 tokens	1024	Otimizado para recuperação legal e aplicativos RAG. Para saber mais, consulte a publicação no blog.

Modelos abertos

A Voyage também fornece os seguintes modelos de peso aberto.

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-4-nano`	32,000 tokens	512 (padrão), 128, 256	Modelo de peso aberto disponível no Abraçando Face. Todas as incorporações criadas com a série 4 são compatíveis entre si Para saber mais, consulte a publicação no blog.

Modelos de incorporação de texto mais antigos

Os modelos antigos a seguir ainda podem ser acessados a partir da API, mas recomendamos usar os novos modelos para maior qualidade e eficiência.

Os modelos mais recentes têm desempenho melhor do que os modelos legado em todos os aspectos, como qualidade, duração do contexto, latência e taxa de transferência.

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-3-large`	32,000 tokens	1024 (padrão), 256, 512, 2048	Geração anterior de incorporações de texto para qualidade de recuperação multilíngue e de uso geral. Para saber mais, consulte a publicação no blog.
`voyage-3.5`	32,000 tokens	1024 (padrão), 256, 512, 2048	Geração anterior de incorporações de texto otimizadas para qualidade de recuperação multilíngue e de uso geral. Para saber mais, consulte a publicação no blog.
`voyage-3.5-lite`	32,000 tokens	1024 (padrão), 256, 512, 2048	Geração anterior de incorporações de texto otimizadas para latência e custo. Para saber mais, consulte a publicação no blog.
`voyage-code-2`	16,000 tokens	1536	Otimizado para recuperação de código (17% melhor que as alternativas). Geração anterior de incorporações de código. Para saber mais, consulte a publicação no blog.

Embeddings de partes contextualizadas

A Voyage IA fornece os seguintes modelos que geram incorporações enquanto incorporam o contexto circundante para melhorar a precisão da recuperação.

Para obter detalhes e exemplo de uso, consulte Incorporações contextuais de partes.

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-context-3`	32,000 tokens	1024 (padrão), 256, 512, 2048	Incorporações de partes contextualizadas otimizadas para qualidade de recuperação multilíngue e de uso geral. Para aprender mais, consulte a publicação no blog.

Incorporações multimodais

O Voyage IA fornece os seguintes modelos de incorporação que processam texto, imagens e vídeo.

Para obter detalhes e exemplo de uso, consulte Incorporações multimodais.

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-multimodal-3.5`	32,000 tokens	1024 (padrão), 256, 512, 2048	Modelo de incorporação multimodal avançado que pode vetorizar texto intercalado e dados visuais, como capturas de tela de PDFs, diapositivas, tabelas, imagens, vídeos e muito mais. Para saber mais, consulte a publicação no blog.

Modelos multimodais mais antigos

Os modelos antigos a seguir ainda podem ser acessados a partir da API, mas recomendamos usar os novos modelos para maior qualidade e eficiência.

Os modelos mais recentes têm desempenho melhor do que os modelos legado em todos os aspectos, como qualidade, duração do contexto, latência e taxa de transferência.

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-multimodal-3`	32,000 tokens	1024	Processa texto e imagens em incorporações unificadas. Suporta imagens de 50,000 a 2 milhões de pixels. Para saber mais, consulte a publicação no blog.

Rerankers

A Voyage AI fornece os seguintes modelos de reclassificação para refinar seus resultados de pesquisa.

Para obter detalhes e exemplo de uso, consulte Rerankers.

Modelo	Comprimento do contexto	Descrição
`rerank-2.5`	32,000	A mais alta precisão. Recomendado para a maioria dos aplicativos. Para saber mais, consulte a publicação no blog.
`rerank-2.5-lite`	32,000	Modelo rápido e econômico otimizado para aplicativos sensíveis à latência. Para saber mais, consulte a publicação no blog.

Rerankers mais antigos

Os modelos antigos a seguir ainda podem ser acessados a partir da API, mas recomendamos usar os novos modelos para maior qualidade e eficiência.

Os modelos mais recentes têm desempenho melhor do que os modelos legado em todos os aspectos, como qualidade, duração do contexto, latência e taxa de transferência.

Modelo	Comprimento do contexto	Descrição
`rerank-2`	16,000 tokens	Nosso reclassificador de segunda geração generalista otimizado para qualidade com suporte multilíngue. Para saber mais, consulte a publicação no blog.
`rerank-2-lite`	8,000 tokens	Nosso reclassificador de segunda geração generalista otimizado para latência e qualidade com suporte multilíngue. Para saber mais, consulte a publicação no blog.

Preços

O preço do modelo é baseado no uso, com cobranças cobradas na conta do Atlas vinculada à chave de API usada para acesso. Todos os modelos incluem uma camada grátis. Comece com 200 milhões de tokens gratuitos para a maioria dos modelos ou 50 milhões de tokens para modelos especializados.

O preço é baseado no número de tokens em seus documentos e queries. A camada grátis inclui 200 milhões de tokens para a maioria dos modelos e 50 milhões de tokens para os seguintes modelos especializados: voyage-finance-2, voyage-law-2, voyage-code-2.

Modelo	Price per 1K tokens	Price per 1M tokens	Tokens grátis
`voyage-4-large`	$0.00012	$0.12	200 milhões
`voyage-4`	$0.00006	$0.06	200 milhões
`voyage-4-lite`	$0.00002	$0.02	200 milhões
`voyage-context-3`	$0.00018	$0.18	200 milhões
`voyage-code-3`	$0.00018	$0.18	200 milhões
`voyage-finance-2` `voyage-law-2` `voyage-code-2`	$0.00012	$0.12	50 milhões

Modelos de incorporação de texto mais antigos

A tabela a seguir mostra os preços dos modelos de incorporação de texto mais antigos. Tokens gratuitos não são oferecidos para esses modelos.

Modelo	Price per 1K tokens	Price per 1M tokens
`voyage-3-large`	$0.00018	$0.18
`voyage-3.5`	$0.00006	$0.06
`voyage-3.5-lite`	$0.00002	$0.02

O preço é baseado no número de tokens em seus documentos e queries.

Modelo	Price per 1K tokens	Price per 1M tokens	Tokens grátis
`voyage-context-3`	$0.00018	$0.18	200 milhões

O preço é baseado em tokens de texto e pixels de imagem. A camada grátis inclui 200 milhões de tokens de texto e 150 bilhões de pixels para modelos multimodais. As imagens são processadas entre 50,000 pixels (mínimo) e 2 milhões de pixels (máximo), com custos que ficam na faixa de $0.00003 a $0.0012 por imagem. Para fins de preços, cada framework de vídeo é considerado uma imagem.

Observação

Imagens com menos de 50,000 pixels são redimensionadas, processadas e cobradas como uma imagem de 50,000bits. Imagens contendo mais de 2 milhões de pixels são reduzidas e cobradas como imagens de 2 milhões de bits.

Modelo	Price per 1M tokens	Price per 1B pixels	camada grátis
`voyage-multimodal-3.5`	$0.12	$0.60	200M tokens, 150B pixels

Resolução da imagem	Número de pixels	Preço por imagem	Price per 1K images
200px × 200px	40,000	$0.00003	$0.03
1000px × 1000px	1 milhões	$0.0006	$0.60
2000px × 2000px	4 milhões	$0.0012	$1.20
4000px × 4000px	16 milhões	$0.0012	$1.20

Exemplo

O custo para vetorizar uma única entrada com 1,000 tokens de texto (US$0.00012) e duas imagens de 4 milhões de bits (2 × $0.0012) seriam de $0.00252.

Modelos multimodais mais antigos

A tabela a seguir mostra os preços dos modelos multimodais mais antigos. Tokens gratuitos não são oferecidos para esses modelos.

Modelo	Price per 1M tokens	Price per 1B pixels	camada grátis
`voyage-multimodal-3`	$0.12	$0.60	0

O preço é baseado no total de tokens processados, calculado como (query tokens × number of documents) + sum of tokens in all documents. A camada grátis inclui 200 milhão de tokens para os modelos de reclassificação mais recentes.

Modelo	Price per 1K tokens	Price per 1M tokens	Est. price per request*	Tokens grátis
`rerank-2.5`	$0.00005	$0.05	$0.0025	200 milhões
`rerank-2.5-lite`	$0.00002	$0.02	$0.001	200 milhões

* O preço estimado pressupõe 100 documentos por solicitação, com a soma de tokens de consulta e tokens por documento totalizando 500.

Rerankers mais antigos

A tabela a seguir mostra os preços dos reclassificadores mais antigos. Tokens gratuitos não são oferecidos para esses modelos.

Modelo	Price per 1K tokens	Price per 1M tokens	Est. price per request*	Tokens grátis
`rerank-2`	$0.00005	$0.05	$0.0025	0
`rerank-2-lite`	$0.00002	$0.02	$0.001	0

Voltar

Início rápido

API e clientes