Los modelos de incrustación de texto de Voyage AI convierten su texto en vectores de alta dimensión que capturan el significado semántico. Los modelos son inherentemente multilingües, lo que significa que la similitud semántica de los textos es independiente del idioma. Utilice los siguientes modelos para potenciar sus aplicaciones de búsqueda de IA con una precisión de recuperación de vanguardia.
Modelos disponibles
Voyage AI proporciona los siguientes modelos de incrustación de texto:
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | La mejor calidad de recuperación multilingüe y de propósito general. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la publicación del blog. |
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Optimizado para una recuperación multilingüe de calidad y de uso general. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Optimizado para latencia y coste. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Optimizado para la recuperación y documentación de código. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 | Optimizado para recuperación de finanzas y aplicaciones RAG. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1024 | Optimizado para recuperación legal y aplicaciones RAG. Para obtener más información, consulte la entrada de blog. |
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 512 (predeterminado), 128, 256 | Modelo de peso abierto disponible en Hugging Face. Todas las incrustaciones creadas con la 4 serie son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
Nuestros últimos modelos funcionan mejor que los modelos anteriores en todos los aspectos, como calidad, duración del contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Generación anterior de incrustaciones de texto para recuperación de calidad general y multilingüe. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Generación anterior de incrustaciones de texto optimizadas para una calidad de recuperación multilingüe y de propósito general. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Generación anterior de incrustaciones de texto optimizadas para latencia y costo. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1536 | Optimizado para la recuperación de código (17% mejor que las alternativas). Generación anterior de incrustaciones de código. Para obtener más información, consulte la entrada de blog. |
Tutorials
Para obtener tutoriales sobre el uso de incrustaciones de texto, consulte los siguientes recursos: