Voyage IA proporciona modelos de embeddings y reranking de vanguardia. de MongoDB Embedding and Reranking API proporciona acceso a los modelos más recientes de Voyage AI. Esta página describe los modelos disponibles y cuándo utilizarlos.
¿Qué son los modelos de incrustación y clasificadores?
Para incrustaciones de texto, recomendamos:
voyage-4-largepara obtener la mejor calidadvoyage-4-litepara la menor latencia y costovoyage-4para un equilibrio entre calidad y rendimientoUn modelo específico para un dominio si tu aplicación pertenece a uno de los dominios enumerados.
Para otros casos de uso, recomendamos:
voyage-multimodal-3.5para incrustaciones de texto, imágenes y vídeosvoyage-context-3para tareas de recuperación a nivel de fragmento y de documentorerank-2.5para agregar la redistribución de clasificación a la mayoría de las aplicacionesrerank-2.5-litepara añadir reordenación a aplicaciones sensibles a la latencia
Incrustaciones de texto
Voyage IA proporciona los siguientes modelos de incrustación de texto para capturar el significado semántico del texto.
Para obtener detalles y ejemplos de uso, consulta text embeddings.
Modelos de propósito general
Utiliza los siguientes modelos para la mayoría de las aplicaciones de búsqueda y recuperación con IA.
Modelo | Longitud del contexto | dimensión | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | La mejor calidad de recuperación de propósito general y multilingüe. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizado para recuperación general y multilingüe de alta calidad. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizado para latencia y costos. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
Modelos Específicos de Dominio
Utiliza los siguientes modelos para dominios especializados con el fin de lograr una mayor precisión.
Modelo | Longitud del contexto | dimensión | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizados para la recuperación de código y la documentación. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 | Optimizado para recuperación de finanzas y aplicaciones RAG. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1024 | Optimizado para aplicaciones legales de recuperación y RAG. Para obtener más información, consulte la entrada de blog. |
Abrir Modelos
Voyage también proporciona los siguientes modelos de peso abierto.
Modelo | Longitud del contexto | dimensión | Descripción |
|---|---|---|---|
| 32,000 tokens | 512 (por defecto), 128, 256 | Modelo de peso abierto disponible en Hugging Face. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí Para obtener más información, consulte la entrada de blog. |
Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.
Modelo | Longitud del contexto | dimensión | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Anterior generación de incrustaciones de texto para calidad de recuperación general y multilingüe. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Generación anterior de incrustaciones de texto optimizadas para la calidad general y multilingüe de recuperación. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Generación anterior de embeddings de texto optimizada para latencia y costo. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1536 | Optimizada para la recuperación de código (17% mejor que las alternativas). Generación anterior de incrustaciones de código. Para obtener más información, consulte la entrada de blog. |
Embeddings de fragmentos contextualizados
Voyage IA proporciona los siguientes modelos que generan vectores de embeebing incorporando el contexto circundante para mejorar la precisión de la recuperación.
Para obtener detalles y ejemplos de uso, consulta Incrustaciones de fragmentos contextualizadas.
Modelo | Longitud del contexto | dimensión | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Embeddings de fragmentos contextualizados optimizados para calidad de recuperación general y multilingüe. Para conocer más, consulta la entrada de blog. |
Incrustaciones multimodales
Voyage IA proporciona los siguientes modelos de incrustación que procesan texto, imágenes y vídeo.
Para detalles y ejemplos de uso, consulta Multimodal Embeddings.
Modelo | Longitud del contexto | dimensión | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Modelo avanzado de integración multimodal que puede vectorizar texto e información visual intercalados, como capturas de pantalla de archivos PDF, diapositivas, tablas, gráficos, videos y mucho más. Para obtener más información, consulte la entrada de blog. |
Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.
Modelo | Longitud del contexto | dimensión | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 | Procesa texto e imágenes en representaciones unificadas. Admite imágenes desde 50,000 hasta 2 millones de píxeles. Para obtener más información, consulte la entrada de blog. |
Rerankers
Voyage IA proporciona los siguientes modelos de reranking para refinar tus resultados de búsqueda.
Para obtener detalles y ejemplos de uso, consulta Reordenadores.
Modelo | Longitud del contexto | Descripción |
|---|---|---|
| 32,000 | Precisión más alta. Recomendado para la mayoría de las aplicaciones. Para obtener más información, consulte la entrada de blog. |
| 32,000 | Modelo rápido y rentable optimizado para aplicaciones sensibles a la latencia. Para obtener más información, consulte la entrada de blog. |
Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Descripción |
|---|---|---|
| 16,000 tokens | Nuestro reranker generalista de segunda generación, optimizado para la calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog. |
| 8,000 tokens | Nuestro reranker generalista de segunda generación optimizado tanto para la latencia como para la calidad, con soporte multilingüe. Para obtener más información, consulte la entrada de blog. |
Precios
La tarificación del modelo se basa en el uso y, los cargos se facturan a la cuenta Atlas vinculada a la clave API utilizada para el acceso. Todos los modelos incluyen un nivel gratuito. Comienza con 200 millones de tokens gratuitos para la mayoría de los modelos o 50 millones de tokens para modelos especializados.
La tarificación se basa en la cantidad de tokens en tus documentos y consultas. El nivel gratuito incluye 200 millones de tokens para la mayoría de los modelos y 50 millones de tokens para los siguientes modelos especializados: voyage-finance-2, voyage-law-2, voyage-code-2.
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens gratuitos |
|---|---|---|---|
| $0.00012 | $0.12 | 200 millón |
| $0.00006 | $0.06 | 200 millón |
| $0.00002 | $0.02 | 200 millón |
| $0.00018 | $0.18 | 200 millón |
| $0.00018 | $0.18 | 200 millón |
voyage-finance-2voyage-law-2voyage-code-2 | $0.00012 | $0.12 | 50 millón |
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens gratuitos |
|---|---|---|---|
| $0.00018 | $0.18 | 0 |
| $0.00006 | $0.06 | 0 |
| $0.00002 | $0.02 | 0 |
El precio se basa en el número de tokens en tus documentos y consultas.
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens gratuitos |
|---|---|---|---|
| $0.00018 | $0.18 | 200 millón |
El precio se basa en tokens de texto y píxeles de imagen. El nivel gratuito incluye 200 millones de tokens de texto y 150 mil millones de píxeles para modelos multimodales. Las imágenes se procesan entre 50,000 píxeles (mínimo) y 2 millones de píxeles (máximo), con costos que varían de $0.00003 a $0.0012 dólares por imagen. Para fines de precios, cada cuadro de video se considera una imagen.
Nota
Las imágenes con menos de 50,000 píxeles se amplían, procesan y cobran como una imagen de 50,000píxeles. Las imágenes que contengan más de 2 millones de píxeles serán reducidas y facturadas como imágenes de 2 millones de píxeles.
Modelo | Price per 1M tokens | Price per 1B pixels | nivel gratuito |
|---|---|---|---|
| $0.12 | $0.60 | 200M tokens, 150B píxeles |
Resolución de imagen | Número de píxeles | Preço por imagem | Price per 1K images |
|---|---|---|---|
200px × 200px | 40,000 | $0.00003 | $0.03 |
1000px × 1000px | 1 millón | $0.0006 | $0.60 |
2000px × 2000px | 4 millón | $0.0012 | $1.20 |
4000px × 4000px | 16 millón | $0.0012 | $1.20 |
Ejemplo
El costo de vectorizar una sola entrada con 1,000 tokens de texto ($0.00012) y dos imágenes de 4 megapíxeles (2 × $0.0012) sería de $0.00252.
La fijación de precios se basa en el total de tokens procesados, calculado como (query tokens × number of documents) + sum of tokens in all documents. El nivel gratuito incluye 200 millón de tokens para los modelos de rerankers más recientes.
Modelo | Price per 1K tokens | Price per 1M tokens | Est. price per request* | Tokens gratuitos |
|---|---|---|---|---|
| $0.00005 | $0.05 | $0.0025 | 200 millón |
| $0.00002 | $0.02 | $0.001 | 200 millón |
* El precio estimado asume 100 documentos por solicitud, con la suma de query tokens y tokens por documento que suman un total de 500.