Los modelos de incrustación de texto de Voyage AI convierten su texto en vectores de alta dimensión que capturan el significado semántico. Los modelos son inherentemente multilingües, lo que significa que la similitud semántica de los textos es independiente del idioma. Utilice los siguientes modelos para potenciar sus aplicaciones de búsqueda de IA con una precisión de recuperación de vanguardia.
Modelos disponibles
Voyage IA proporciona los siguientes modelos de incrustación de textos:
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | La mejor calidad de recuperación multilingüe y de propósito general. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la publicación del blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizado para recuperación general y multilingüe de alta calidad. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizado para latencia y coste. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizados para la recuperación de código y la documentación. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 | Optimizado para recuperación de finanzas y aplicaciones RAG. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1024 | Optimizado para aplicaciones legales de recuperación y RAG. Para obtener más información, consulte la entrada de blog. |
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 512 (predeterminado), 128, 256 | Modelo de peso abierto disponible en Hugging Face. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí Para obtener más información, consulte la entrada de blog. |
Nuestros modelos más recientes superan a los modelos heredados en todos los aspectos, tales como calidad, longitud del contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Generación anterior de incrustaciones de texto para recuperación de calidad general y multilingüe. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Generación anterior de incrustaciones de texto optimizadas para una calidad de recuperación multilingüe y de propósito general. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Generación anterior de embeddings de texto optimizada para latencia y costo. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1536 | Optimizada para la recuperación de código (17% mejor que las alternativas). Generación anterior de incrustaciones de código. Para obtener más información, consulte la entrada de blog. |
Tutorials
Para obtener tutoriales sobre el uso de incrustaciones de texto, consulte los siguientes recursos: