Voyage AI proporciona modelos de incrustación y reclasificación de última generación. MongoDB La API de Integración y Reclasificación proporciona acceso a los modelos de IA de Voyage más recientes. Esta página describe los modelos disponibles y cuándo usarlos.
¿Qué son los modelos de incrustación y los rerankers?
Para incrustar texto, recomendamos:
voyage-4-largepara la mejor calidadvoyage-4-litepara la menor latencia y costovoyage-4para un equilibrio entre calidad y rendimientoUn modelo específico del dominio si su aplicación está en uno de los dominios enumerados.
Para otros casos de uso, recomendamos:
voyage-multimodal-3.5para incrustaciones de texto, imágenes y vídeosvoyage-context-3para tareas de recuperación a nivel de fragmento y de documentorerank-2.5para agregar reclasificación a la mayoría de las aplicacionesrerank-2.5-litepara agregar reclasificación a aplicaciones sensibles a la latencia
Incrustaciones de texto
Voyage AI proporciona los siguientes modelos de incrustación de texto para capturar el significado semántico del texto.
Para obtener más detalles y ejemplos de uso, consulte Incrustaciones de texto.
Modelos de propósito general
Utilice los siguientes modelos para la mayoría de aplicaciones de búsqueda y recuperación de IA.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | La mejor calidad de recuperación multilingüe y de propósito general. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la publicación del blog. |
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Optimizado para una recuperación multilingüe de calidad y de uso general. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Optimizado para latencia y coste. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
Modelos específicos del dominio
Utilice los siguientes modelos para dominios especializados para lograr una mayor precisión.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Optimizado para la recuperación y documentación de código. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 | Optimizado para recuperación de finanzas y aplicaciones RAG. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1024 | Optimizado para recuperación legal y aplicaciones RAG. Para obtener más información, consulte la entrada de blog. |
Abrir Modelos
Voyage también ofrece los siguientes modelos de peso abierto.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 512 (predeterminado), 128, 256 | Modelo de peso abierto disponible en Hugging Face. Todas las incrustaciones creadas con la 4 serie son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
Los modelos más recientes funcionan mejor que los modelos heredados en todos los aspectos, como calidad, duración del contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Generación anterior de incrustaciones de texto para recuperación de calidad general y multilingüe. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Generación anterior de incrustaciones de texto optimizadas para una calidad de recuperación multilingüe y de propósito general. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Generación anterior de incrustaciones de texto optimizadas para latencia y costo. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1536 | Optimizado para la recuperación de código (17% mejor que las alternativas). Generación anterior de incrustaciones de código. Para obtener más información, consulte la entrada de blog. |
Incrustaciones de fragmentos contextualizados
Voyage AI proporciona los siguientes modelos que generan incrustaciones al tiempo que incorporan el contexto circundante para mejorar la precisión de recuperación.
Para obtener detalles y ejemplos de uso, consulta Incrustaciones de fragmentos contextualizadas.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Incrustaciones de fragmentos contextualizados optimizados para una calidad de recuperación multilingüe y de propósito general. Para obtener más información, consulte la publicación del blog. |
Incrustaciones multimodales
Voyage AI proporciona los siguientes modelos de integración que procesan texto, imágenes y videos.
Para obtener más detalles y ejemplos de uso, consulte Incrustaciones multimodales.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (predeterminado), 256, 512, 2048 | Modelo de incrustación multimodal enriquecido que puede vectorizar texto intercalado y datos visuales, como capturas de pantalla de archivos PDF, diapositivas, tablas, figuras, videos y más. Para obtener más información, consulte la entrada de blog. |
Los modelos más recientes funcionan mejor que los modelos heredados en todos los aspectos, como calidad, duración del contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 | Procesa texto e imágenes en representaciones unificadas. Admite imágenes desde 50,000 hasta 2 millones de píxeles. Para obtener más información, consulte la entrada de blog. |
Rerankers
Voyage AI proporciona los siguientes modelos de reclasificación para refinar sus resultados de búsqueda.
Para obtener más detalles y ejemplos de uso, consulte Rerankers.
Modelo | Longitud del contexto | Descripción |
|---|---|---|
| 32,000 | Precisión más alta. Recomendado para la mayoría de las aplicaciones. Para obtener más información, consulte la entrada de blog. |
| 32,000 | Modelo rápido y rentable optimizado para aplicaciones sensibles a la latencia. Para obtener más información, consulte la entrada de blog. |
Los modelos más recientes funcionan mejor que los modelos heredados en todos los aspectos, como calidad, duración del contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Descripción |
|---|---|---|
| 16,000 tokens | Nuestro reranker generalista de segunda generación optimizado para la calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog. |
| 8,000 tokens | Nuestro reranker generalista de segunda generación optimizado tanto para latencia como para calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog. |
Precios
El precio de los modelos se basa en el uso, y los cargos se facturan a la cuenta de Atlas vinculada a la clave API utilizada para el acceso. Todos los modelos incluyen un nivel gratuito. Empieza con 200 millones de tokens gratuitos para la mayoría de los modelos o 50 millones de tokens para los modelos especializados.
El precio se basa en la cantidad de tokens en sus documentos y consultas. El plan gratuito incluye 200 millones de tokens para la mayoría de los modelos y 50 millones de tokens para los siguientes modelos especializados: voyage-finance-2, voyage-law-2 y voyage-code-2.
Modelo | Price per 1K tokens | Price per 1M tokens | Fichas gratis |
|---|---|---|---|
| $0.00012 | $0.12 | 200 millón |
| $0.00006 | $0.06 | 200 millón |
| $0.00002 | $0.02 | 200 millón |
| $0.00018 | $0.18 | 200 millón |
| $0.00018 | $0.18 | 200 millón |
voyage-finance-2voyage-law-2voyage-code-2 | $0.00012 | $0.12 | 50 millón |
Modelo | Price per 1K tokens | Price per 1M tokens | Fichas gratis |
|---|---|---|---|
| $0.00018 | $0.18 | 0 |
| $0.00006 | $0.06 | 0 |
| $0.00002 | $0.02 | 0 |
El precio se basa en la cantidad de tokens en sus documentos y consultas.
Modelo | Price per 1K tokens | Price per 1M tokens | Fichas gratis |
|---|---|---|---|
| $0.00018 | $0.18 | 200 millón |
El precio se basa en tokens de texto y píxeles de imagen. El plan gratuito incluye 200 millones de tokens de texto y 150 mil millones de píxeles para modelos multimodales. Las imágenes se procesan 50 entre,000 píxeles (mínimo) y 2 millones de píxeles (máximo), con costos que oscilan entre0.00003 $8100 y $83000.0012 por imagen. A efectos de precios, cada fotograma de vídeo se considera una imagen.
Nota
Las imágenes con menos de 50,000 píxeles se amplían, procesan y cobran como una imagen de 50,000píxeles. Las imágenes que contengan más de 2 millones de píxeles serán reducidas y facturadas como imágenes de 2 millones de píxeles.
Modelo | Price per 1M tokens | Price per 1B pixels | nivel gratuito |
|---|---|---|---|
| $0.12 | $0.60 | 200M tokens, 150B píxeles |
Resolución de la imagen | Número de píxeles | Precio por imagen | Price per 1K images |
|---|---|---|---|
200px × 200px | 40,000 | $0.00003 | $0.03 |
1000px × 1000px | 1 millón | $0.0006 | $0.60 |
2000px × 2000px | 4 millón | $0.0012 | $1.20 |
4000px × 4000px | 16 millón | $0.0012 | $1.20 |
Ejemplo
El costo de vectorizar una sola entrada con 1,000 tokens de texto ($0.00012) y dos imágenes de 4 megapíxeles (2 × $0.0012) sería de $0.00252.
El precio se basa en el total de tokens procesados, calculado como (query tokens × number of documents) + sum of tokens in all documents. El plan gratuito incluye 200 millón de tokens para los modelos de reranking más recientes.
Modelo | Price per 1K tokens | Price per 1M tokens | Est. price per request* | Fichas gratis |
|---|---|---|---|---|
| $0.00005 | $0.05 | $0.0025 | 200 millón |
| $0.00002 | $0.02 | $0.001 | 200 millón |
* El precio estimado supone 100 documentos por solicitud, y la suma de tokens de consulta y tokens por documento suma un total de 500.