Voyage IA proporciona modelos de embeddings y reranking de vanguardia. de MongoDB Embedding and Reranking API proporciona acceso a los modelos más recientes de Voyage AI. Esta página describe los modelos disponibles y cuándo utilizarlos.
¿Qué son los modelos de incrustación y clasificadores?
Para incrustaciones de texto, recomendamos:
voyage-4-largepara obtener la mejor calidadvoyage-4-litepara la menor latencia y costovoyage-4para un equilibrio entre calidad y rendimientoUn modelo específico del dominio si su aplicación está en uno de los dominios enumerados.
Para otros casos de uso, recomendamos:
voyage-multimodal-3.5para incrustaciones de texto, imágenes y vídeosvoyage-context-3para tareas de recuperación a nivel de fragmento y de documentorerank-2.5para agregar la redistribución de clasificación a la mayoría de las aplicacionesrerank-2.5-litepara agregar reclasificación a aplicaciones sensibles a la latencia
Incrustaciones de texto
Voyage IA proporciona los siguientes modelos de incrustación de texto para capturar el significado semántico del texto.
Para obtener detalles y ejemplos de uso, consulta text embeddings.
Modelos de propósito general
Utiliza los siguientes modelos para la mayoría de las aplicaciones de búsqueda y recuperación con IA.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | La mejor calidad de recuperación multilingüe y de propósito general. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la publicación del blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizado para recuperación general y multilingüe de alta calidad. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizado para latencia y coste. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog. |
Modelos específicos del dominio
Utilice los siguientes modelos para dominios especializados para lograr una mayor precisión.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Optimizados para la recuperación de código y la documentación. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 | Optimizado para recuperación de finanzas y aplicaciones RAG. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1024 | Optimizado para aplicaciones legales de recuperación y RAG. Para obtener más información, consulte la entrada de blog. |
Abrir Modelos
Voyage también ofrece los siguientes modelos de peso abierto.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 512 (predeterminado), 128, 256 | Modelo de peso abierto disponible en Hugging Face. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí Para obtener más información, consulte la entrada de blog. |
Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Generación anterior de incrustaciones de texto para recuperación de calidad general y multilingüe. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Generación anterior de incrustaciones de texto optimizadas para una calidad de recuperación multilingüe y de propósito general. Para obtener más información, consulte la entrada de blog. |
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Generación anterior de embeddings de texto optimizada para latencia y costo. Para obtener más información, consulte la entrada de blog. |
| 16,000 tokens | 1536 | Optimizada para la recuperación de código (17% mejor que las alternativas). Generación anterior de incrustaciones de código. Para obtener más información, consulte la entrada de blog. |
Embeddings de fragmentos contextualizados
Voyage AI proporciona los siguientes modelos que generan incrustaciones al tiempo que incorporan el contexto circundante para mejorar la precisión de recuperación.
Para obtener detalles y ejemplos de uso, consulta Incrustaciones de fragmentos contextualizadas.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Incrustaciones de fragmentos contextualizados optimizados para una calidad de recuperación multilingüe y de propósito general. Para conocer más, consulta la entrada de blog. |
Incrustaciones multimodales
Voyage IA proporciona los siguientes modelos de incrustación que procesan texto, imágenes y vídeo.
Para detalles y ejemplos de uso, consulta Multimodal Embeddings.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 (por defecto), 256, 512, 2048 | Modelo de incrustación multimodal enriquecido que puede vectorizar texto intercalado y datos visuales, como capturas de pantalla de archivos PDF, diapositivas, tablas, figuras, videos y más. Para obtener más información, consulte la entrada de blog. |
Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Dimensiones | Descripción |
|---|---|---|---|
| 32,000 tokens | 1024 | Procesa texto e imágenes en representaciones unificadas. Admite imágenes desde 50,000 hasta 2 millones de píxeles. Para obtener más información, consulte la entrada de blog. |
Rerankers
Voyage AI proporciona los siguientes modelos de reclasificación para refinar sus resultados de búsqueda.
Para obtener detalles y ejemplos de uso, consulta Reordenadores.
Modelo | Longitud del contexto | Descripción |
|---|---|---|
| 32,000 | Precisión más alta. Recomendado para la mayoría de las aplicaciones. Para obtener más información, consulte la entrada de blog. |
| 32,000 | Modelo rápido y rentable optimizado para aplicaciones sensibles a la latencia. Para obtener más información, consulte la entrada de blog. |
Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Descripción |
|---|---|---|
| 16,000 tokens | Nuestro reranker generalista de segunda generación, optimizado para la calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog. |
| 8,000 tokens | Nuestro reranker generalista de segunda generación optimizado tanto para latencia como para calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog. |
Precios
La tarificación del modelo se basa en el uso y, los cargos se facturan a la cuenta Atlas vinculada a la clave API utilizada para el acceso. Todos los modelos incluyen un nivel gratuito. Comienza con 200 millones de tokens gratuitos para la mayoría de los modelos o 50 millones de tokens para modelos especializados.
La tarificación se basa en la cantidad de tokens en tus documentos y consultas. El nivel gratuito incluye 200 millones de tokens para la mayoría de los modelos y 50 millones de tokens para los siguientes modelos especializados: voyage-finance-2, voyage-law-2, voyage-code-2.
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens gratuitos |
|---|---|---|---|
| $0.00012 | $0.12 | 200 millón |
| $0.00006 | $0.06 | 200 millón |
| $0.00002 | $0.02 | 200 millón |
| $0.00018 | $0.18 | 200 millón |
| $0.00018 | $0.18 | 200 millón |
voyage-finance-2voyage-law-2voyage-code-2 | $0.00012 | $0.12 | 50 millón |
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens gratuitos |
|---|---|---|---|
| $0.00018 | $0.18 | 0 |
| $0.00006 | $0.06 | 0 |
| $0.00002 | $0.02 | 0 |
El precio se basa en la cantidad de tokens en sus documentos y consultas.
Modelo | Price per 1K tokens | Price per 1M tokens | Tokens gratuitos |
|---|---|---|---|
| $0.00018 | $0.18 | 200 millón |
El precio se basa en tokens de texto y píxeles de imagen. El nivel gratuito incluye 200 millones de tokens de texto y 150 mil millones de píxeles para modelos multimodales. Las imágenes se procesan entre 50,000 píxeles (mínimo) y 2 millones de píxeles (máximo), con costos que varían de $0.00003 a $0.0012 dólares por imagen. Para fines de precios, cada cuadro de video se considera una imagen.
Nota
Las imágenes con menos de 50,000 píxeles se amplían, procesan y cobran como una imagen de 50,000píxeles. Las imágenes que contengan más de 2 millones de píxeles serán reducidas y facturadas como imágenes de 2 millones de píxeles.
Modelo | Price per 1M tokens | Price per 1B pixels | nivel gratuito |
|---|---|---|---|
| $0.12 | $0.60 | 200M tokens, 150B píxeles |
Resolución de imagen | Número de píxeles | Preço por imagem | Price per 1K images |
|---|---|---|---|
200px × 200px | 40,000 | $0.00003 | $0.03 |
1000px × 1000px | 1 millón | $0.0006 | $0.60 |
2000px × 2000px | 4 millón | $0.0012 | $1.20 |
4000px × 4000px | 16 millón | $0.0012 | $1.20 |
Ejemplo
El costo de vectorizar una sola entrada con 1,000 tokens de texto ($0.00012) y dos imágenes de 4 megapíxeles (2 × $0.0012) sería de $0.00252.
El precio se basa en el total de tokens procesados, calculado como (query tokens × number of documents) + sum of tokens in all documents. El plan gratuito incluye 200 millón de tokens para los modelos de reranking más recientes.
Modelo | Price per 1K tokens | Price per 1M tokens | Est. price per request* | Tokens gratuitos |
|---|---|---|---|---|
| $0.00005 | $0.05 | $0.0025 | 200 millón |
| $0.00002 | $0.02 | $0.001 | 200 millón |
* El precio estimado asume 100 documentos por solicitud, con la suma de query tokens y tokens por documento que suman un total de 500.