Incorporações de texto

A API de incorporação e reclassificação está na visualização. O recurso e a documentação correspondente podem mudar a qualquer momento durante o período de pré-visualização.

Os modelos de incorporação de texto do Voyage IA convertem seu texto em vetores de alta dimensão que capturam o significado semântica. Os modelos são inerentemente multilíngues, o que significa que a similaridade semântica dos textos é independente do idioma. Use os modelos a seguir para alimentar seus aplicativos de pesquisa de IA com precisão de recuperação de última geração.

Modelos disponíveis

O Voyage IA fornece os seguintes modelos de incorporação de texto:

Modelos de uso geral

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-4-large`	32,000 tokens	1024 (padrão), 256, 512, 2048	A melhor qualidade de recuperação para uso geral e multilíngue. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog.
`voyage-4`	32,000 tokens	1024 (padrão), 256, 512, 2048	Otimizado para qualidade de recuperação de uso geral e multilíngue. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog.
`voyage-4-lite`	32,000 tokens	1024 (padrão), 256, 512, 2048	Otimizado para latência e custo. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação no blog.

Modelos específicos de domínio

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-code-3`	32,000 tokens	1024 (padrão), 256, 512, 2048	Otimizado para recuperação e documentação de código. Para saber mais, consulte a publicação no blog.
`voyage-finance-2`	32,000 tokens	1024	Otimizado para recuperação de crédito e aplicativos RAG. Para saber mais, consulte a publicação no blog.
`voyage-law-2`	16,000 tokens	1024	Otimizado para recuperação legal e aplicativos RAG. Para saber mais, consulte a publicação no blog.

Modelos abertos

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-4-nano`	32,000 tokens	512 (padrão), 128, 256	Modelo de peso aberto disponível no Abraçando Face. Todas as incorporações criadas com a série 4 são compatíveis entre si Para saber mais, consulte a publicação no blog.

Modelos mais antigos

Os modelos mais antigos a seguir ainda podem ser acessados a partir da nossa API, mas recomendamos o uso dos novos modelos acima para melhor qualidade e eficiência.

Nossos modelos mais recentes têm desempenho melhor do que os modelos legado em todos os aspectos, como qualidade, duração do contexto, latência e taxa de transferência.

Modelo	Comprimento do contexto	Dimensões	Descrição
`voyage-3-large`	32,000 tokens	1024 (padrão), 256, 512, 2048	Geração anterior de incorporações de texto para qualidade de recuperação multilíngue e de uso geral. Para saber mais, consulte a publicação no blog.
`voyage-3.5`	32,000 tokens	1024 (padrão), 256, 512, 2048	Geração anterior de incorporações de texto otimizadas para qualidade de recuperação multilíngue e de uso geral. Para saber mais, consulte a publicação no blog.
`voyage-3.5-lite`	32,000 tokens	1024 (padrão), 256, 512, 2048	Geração anterior de incorporações de texto otimizadas para latência e custo. Para saber mais, consulte a publicação no blog.
`voyage-code-2`	16,000 tokens	1536	Otimizado para recuperação de código (17% melhor que as alternativas). Geração anterior de incorporações de código. Para saber mais, consulte a publicação no blog.

Tutorials

Para tutoriais sobre como usar incorporações de texto, consulte os seguintes recursos:

Uso

Linguagem

Embeddings de partes contextualizadas