Resumen de modelos

Voyage AI proporciona modelos de incrustación y reclasificación de última generación. La API de integración y reclasificación de MongoDB permite acceder a los últimos modelos de Voyage IA. Esta página describe los modelos disponibles y cuándo utilizarlos.

¿Qué son los modelos de incrustación y clasificadores?

Elegir un modelo

Expanda esta sección para obtener más información sobre cuál modelo elegir para su caso de uso.

Para incrustaciones de texto, recomendamos:

voyage-4-large para obtener la mejor calidad
voyage-4-lite para la menor latencia y costo
voyage-4 para un equilibrio entre calidad y rendimiento
Un modelo específico para un dominio si tu aplicación pertenece a uno de los dominios enumerados.

Para otros casos de uso, recomendamos:

voyage-multimodal-3.5 para incrustaciones de texto, imágenes y vídeos
voyage-context-4 para tareas de recuperación a nivel de fragmento y de documento
rerank-2.5 para agregar la redistribución de clasificación a la mayoría de las aplicaciones
rerank-2.5-lite para añadir reordenación a aplicaciones sensibles a la latencia

Incrustaciones de texto

Voyage IA proporciona los siguientes modelos de incrustación de texto para capturar el significado semántico del texto.

Para obtener detalles y ejemplos de uso, consulta text embeddings.

Modelos de propósito general

Utiliza los siguientes modelos para la mayoría de las aplicaciones de búsqueda y recuperación con IA.

Modelo	Longitud del contexto	dimensión	Descripción
`voyage-4-large`	32,000 tokens	1024 (por defecto), 256, 512, 2048	La mejor calidad de recuperación de propósito general y multilingüe. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog.
`voyage-4`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Optimizado para recuperación general y multilingüe de alta calidad. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog.
`voyage-4-lite`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Optimizado para latencia y costos. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog.

Modelos Específicos de Dominio

Utiliza los siguientes modelos para dominios especializados con el fin de lograr una mayor precisión.

Modelo	Longitud del contexto	dimensión	Descripción
`voyage-code-3`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Optimizados para la recuperación de código y la documentación. Para obtener más información, consulte la entrada de blog.
`voyage-finance-2`	32,000 tokens	1024	Optimizado para recuperación de finanzas y aplicaciones RAG. Para obtener más información, consulte la entrada de blog.
`voyage-law-2`	16,000 tokens	1024	Optimizado para aplicaciones legales de recuperación y RAG. Para obtener más información, consulte la entrada de blog.

Abrir Modelos

Voyage también proporciona los siguientes modelos de peso abierto.

Modelo	Longitud del contexto	dimensión	Descripción
`voyage-4-nano`	32,000 tokens	512 (por defecto), 128, 256	Modelo de peso abierto disponible en Hugging Face. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí Para obtener más información, consulte la entrada de blog.

Modelos antiguos de alojamiento de texto

Los siguientes modelos antiguos aún son accesibles a través de la API, pero recomendamos usar los modelos nuevos para obtener una mejor calidad y eficiencia.

Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.

Modelo	Longitud del contexto	dimensión	Descripción
`voyage-3-large`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Anterior generación de incrustaciones de texto para calidad de recuperación general y multilingüe. Para obtener más información, consulte la entrada de blog.
`voyage-3.5`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Generación anterior de incrustaciones de texto optimizadas para la calidad general y multilingüe de recuperación. Para obtener más información, consulte la entrada de blog.
`voyage-3.5-lite`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Generación anterior de embeddings de texto optimizada para latencia y costo. Para obtener más información, consulte la entrada de blog.
`voyage-code-2`	16,000 tokens	1536	Optimizada para la recuperación de código (17% mejor que las alternativas). Generación anterior de incrustaciones de código. Para obtener más información, consulte la entrada de blog.

Embeddings de fragmentos contextualizados

Voyage IA proporciona los siguientes modelos que generan vectores de embeebing incorporando el contexto circundante para mejorar la precisión de la recuperación.

Para obtener detalles y ejemplos de uso, consulta Incrustaciones de fragmentos contextualizadas.

Modelo	Longitud del contexto	dimensión	Descripción
En vista previa: `voyage-context-4`	120,000 tokens *	1024 (por defecto), 256, 512, 2048	Embeddings de fragmentos contextualizados optimizados para calidad de recuperación general y multilingüe.
`voyage-context-3`	120,000 tokens *	1024 (por defecto), 256, 512, 2048	Embeddings de fragmentos contextualizados optimizados para calidad de recuperación general y multilingüe. Para conocer más, consulta la entrada de blog.

Nota

* El número total de tokens en todas las entradas no debe exceder los 120K si enable_auto_chunk = true; de lo contrario, no deben exceder los 32K.

Incrustaciones multimodales

Voyage IA proporciona los siguientes modelos de incrustación que procesan texto, imágenes y vídeo.

Para detalles y ejemplos de uso, consulta Multimodal Embeddings.

Modelo	Longitud del contexto	dimensión	Descripción
`voyage-multimodal-3.5`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Modelo avanzado de integración multimodal que puede vectorizar texto e información visual intercalados, como capturas de pantalla de archivos PDF, diapositivas, tablas, gráficos, videos y mucho más. Para obtener más información, consulte la entrada de blog.

Modelos multimodales antiguos

Los siguientes modelos antiguos aún son accesibles a través de la API, pero recomendamos usar los modelos nuevos para obtener una mejor calidad y eficiencia.

Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.

Modelo	Longitud del contexto	dimensión	Descripción
`voyage-multimodal-3`	32,000 tokens	1024	Procesa texto e imágenes en representaciones unificadas. Admite imágenes desde 50,000 hasta 2 millones de píxeles. Para obtener más información, consulte la entrada de blog.

Rerankers

Voyage IA proporciona los siguientes modelos de reranking para refinar tus resultados de búsqueda.

Para obtener detalles y ejemplos de uso, consulta Reordenadores.

Modelo	Longitud del contexto	Descripción
`rerank-2.5`	32,000	Precisión más alta. Recomendado para la mayoría de las aplicaciones. Para obtener más información, consulte la entrada de blog.
`rerank-2.5-lite`	32,000	Modelo rápido y rentable optimizado para aplicaciones sensibles a la latencia. Para obtener más información, consulte la entrada de blog.

Reclasificadores antiguos

Los siguientes modelos antiguos aún son accesibles a través de la API, pero recomendamos usar los modelos nuevos para obtener una mejor calidad y eficiencia.

Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.

Modelo	Longitud del contexto	Descripción
`rerank-2`	16,000 tokens	Nuestro reranker generalista de segunda generación, optimizado para la calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog.
`rerank-2-lite`	8,000 tokens	Nuestro reranker generalista de segunda generación optimizado tanto para la latencia como para la calidad, con soporte multilingüe. Para obtener más información, consulte la entrada de blog.

Precios

La tarificación del modelo se basa en el uso y, los cargos se facturan a la cuenta Atlas vinculada a la clave API utilizada para el acceso. Todos los modelos incluyen un nivel gratuito. Comienza con 200 millones de tokens gratuitos para la mayoría de los modelos o 50 millones de tokens para modelos especializados.

La tarificación se basa en la cantidad de tokens en tus documentos y consultas. El nivel gratuito incluye 200 millones de tokens para la mayoría de los modelos y 50 millones de tokens para los siguientes modelos especializados: voyage-finance-2, voyage-law-2, voyage-code-2.

Modelo	Price per 1K tokens	Price per 1M tokens	Tokens gratuitos
`voyage-4-large`	$0.00012	$0.12	200 millón
`voyage-4`	$0.00006	$0.06	200 millón
`voyage-4-lite`	$0.00002	$0.02	200 millón
`voyage-code-3`	$0.00018	$0.18	200 millón
`voyage-finance-2` `voyage-law-2` `voyage-code-2`	$0.00012	$0.12	50 millón

Modelos antiguos de alojamiento de texto

La siguiente tabla muestra los precios de los modelos antiguos de incrustación de texto. No se ofrecen fichas gratuitas para estos modelos.

Modelo	Price per 1K tokens	Price per 1M tokens
`voyage-3-large`	$0.00018	$0.18
`voyage-3.5`	$0.00006	$0.06
`voyage-3.5-lite`	$0.00002	$0.02

El precio se basa en el número de tokens en tus documentos y consultas.

Modelo	Price per 1K tokens	Price per 1M tokens	Tokens gratuitos
`voyage-context-4`	$0.00012	$0.12	200 millón

El precio se basa en tokens de texto y píxeles de imagen. El nivel gratuito incluye 200 millones de tokens de texto y 150 mil millones de píxeles para modelos multimodales. Las imágenes se procesan entre 50,000 píxeles (mínimo) y 2 millones de píxeles (máximo), con costos que varían de $0.00003 a $0.0012 dólares por imagen. Para fines de precios, cada cuadro de video se considera una imagen.

Nota

Las imágenes con menos de 50,000 píxeles se amplían, procesan y cobran como una imagen de 50,000píxeles. Las imágenes que contengan más de 2 millones de píxeles serán reducidas y facturadas como imágenes de 2 millones de píxeles.

Modelo	Price per 1M tokens	Price per 1B pixels	nivel gratuito
`voyage-multimodal-3.5`	$0.12	$0.60	200M tokens, 150B píxeles

Resolución de imagen	Número de píxeles	Preço por imagem	Price per 1K images
200px × 200px	40,000	$0.00003	$0.03
1000px × 1000px	1 millón	$0.0006	$0.60
2000px × 2000px	4 millón	$0.0012	$1.20
4000px × 4000px	16 millón	$0.0012	$1.20

Ejemplo

El costo de vectorizar una sola entrada con 1,000 tokens de texto ($0.00012) y dos imágenes de 4 megapíxeles (2 × $0.0012) sería de $0.00252.

Modelos multimodales antiguos

La siguiente tabla muestra los precios de los modelos multimodales antiguos. No se ofrecen fichas gratuitas para estos modelos.

Modelo	Price per 1M tokens	Price per 1B pixels	nivel gratuito
`voyage-multimodal-3`	$0.12	$0.60	0

La fijación de precios se basa en el total de tokens procesados, calculado como (query tokens × number of documents) + sum of tokens in all documents. El nivel gratuito incluye 200 millón de tokens para los modelos de rerankers más recientes.

Modelo	Price per 1K tokens	Price per 1M tokens	Est. price per request*	Tokens gratuitos
`rerank-2.5`	$0.00005	$0.05	$0.0025	200 millón
`rerank-2.5-lite`	$0.00002	$0.02	$0.001	200 millón

* El precio estimado asume 100 documentos por solicitud, con la suma de query tokens y tokens por documento que suman un total de 500.

Reclasificadores antiguos

La siguiente tabla muestra los precios para Reclassificadores anteriores. No se ofrecen fichas gratuitas para estos modelos.

Modelo	Price per 1K tokens	Price per 1M tokens	Est. price per request*	Tokens gratuitos
`rerank-2`	$0.00005	$0.05	$0.0025	0
`rerank-2-lite`	$0.00002	$0.02	$0.001	0

Volver

Inicio rápido

API y Clientes