Os modelos de incorporação de texto do Voyage AI convertem seu texto em vetores de alta dimensão que capturam o significado semântica. Os modelos são inerentemente multilíngues, o que significa que a similaridade semântica dos textos é independente do idioma. Use os modelos a seguir para alimentar seus aplicativos de pesquisa de IA com precisão de recuperação de última geração.
Modelos disponíveis
O Voyage AI fornece os seguintes modelos de incorporação de texto:
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | A melhor qualidade de recuperação para uso geral e multilíngue. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação do blog. |
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Otimizado para qualidade de recuperação de uso geral e multilíngue. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação do blog. |
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Otimizado para latência e custo. Todas as incorporações criadas com a série 4 são compatíveis entre si. Para saber mais, consulte a publicação do blog. |
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Otimizado para recuperação e documentação de código. Para saber mais, consulte a publicação do blog. |
| 32,000 tokens | 1024 | Otimizado para recuperação de crédito e aplicativos RAG. Para saber mais, consulte a publicação do blog. |
| 16,000 tokens | 1024 | Otimizado para recuperação legal e aplicativos RAG. Para saber mais, consulte a publicação do blog. |
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 512 (padrão), 128, 256 | Modelo de peso aberto disponível no Abraçando Face. Todas as incorporações criadas com a 4 série são compatíveis entre si Para saber mais, consulte a publicação do blog. |
Nossos modelos mais recentes têm desempenho melhor do que os modelos legado em todos os aspectos, como qualidade, duração do contexto, latência e taxa de transferência.
Modelo | Comprimento do contexto | Dimensões | Descrição |
|---|---|---|---|
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Geração anterior de incorporações de texto para qualidade de recuperação multilíngue e de uso geral. Para saber mais, consulte a publicação do blog. |
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Geração anterior de incorporações de texto otimizadas para qualidade de recuperação multilíngue e de uso geral. Para saber mais, consulte a publicação do blog. |
| 32,000 tokens | 1024 (padrão), 256, 512, 2048 | Geração anterior de incorporações de texto otimizadas para latência e custo. Para saber mais, consulte a publicação do blog. |
| 16,000 tokens | 1536 | Otimizado para recuperação de código (17% melhor que as alternativas). Geração anterior de incorporações de código. Para saber mais, consulte a publicação do blog. |
Tutorials
Para tutoriais sobre como usar incorporações de texto, consulte os seguintes recursos: