Resumen de modelos

La API de incrustación y re clasificación se encuentra en Vista previa. La funcionalidad y la documentación correspondiente pueden cambiar en cualquier momento durante el periodo de vista previa.

Voyage IA proporciona modelos de embeddings y reranking de vanguardia. de MongoDB Embedding and Reranking API proporciona acceso a los modelos más recientes de Voyage AI. Esta página describe los modelos disponibles y cuándo utilizarlos.

¿Qué son los modelos de incrustación y clasificadores?

Elegir un modelo

Amplíe esta sección para obtener más información sobre qué modelo elegir para su caso de uso.

Para incrustaciones de texto, recomendamos:

voyage-4-large para obtener la mejor calidad
voyage-4-lite para la menor latencia y costo
voyage-4 para un equilibrio entre calidad y rendimiento
Un modelo específico del dominio si su aplicación está en uno de los dominios enumerados.

Para otros casos de uso, recomendamos:

voyage-multimodal-3.5 para incrustaciones de texto, imágenes y vídeos
voyage-context-3 para tareas de recuperación a nivel de fragmento y de documento
rerank-2.5 para agregar la redistribución de clasificación a la mayoría de las aplicaciones
rerank-2.5-lite para agregar reclasificación a aplicaciones sensibles a la latencia

Incrustaciones de texto

Voyage IA proporciona los siguientes modelos de incrustación de texto para capturar el significado semántico del texto.

Para obtener detalles y ejemplos de uso, consulta text embeddings.

Modelos de propósito general

Utiliza los siguientes modelos para la mayoría de las aplicaciones de búsqueda y recuperación con IA.

Modelo	Longitud del contexto	Dimensiones	Descripción
`voyage-4-large`	32,000 tokens	1024 (por defecto), 256, 512, 2048	La mejor calidad de recuperación multilingüe y de propósito general. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la publicación del blog.
`voyage-4`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Optimizado para recuperación general y multilingüe de alta calidad. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog.
`voyage-4-lite`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Optimizado para latencia y coste. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí. Para obtener más información, consulte la entrada de blog.

Modelos específicos del dominio

Utilice los siguientes modelos para dominios especializados para lograr una mayor precisión.

Modelo	Longitud del contexto	Dimensiones	Descripción
`voyage-code-3`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Optimizados para la recuperación de código y la documentación. Para obtener más información, consulte la entrada de blog.
`voyage-finance-2`	32,000 tokens	1024	Optimizado para recuperación de finanzas y aplicaciones RAG. Para obtener más información, consulte la entrada de blog.
`voyage-law-2`	16,000 tokens	1024	Optimizado para aplicaciones legales de recuperación y RAG. Para obtener más información, consulte la entrada de blog.

Abrir Modelos

Voyage también ofrece los siguientes modelos de peso abierto.

Modelo	Longitud del contexto	Dimensiones	Descripción
`voyage-4-nano`	32,000 tokens	512 (predeterminado), 128, 256	Modelo de peso abierto disponible en Hugging Face. Todas las incrustaciones creadas con la serie 4 son compatibles entre sí Para obtener más información, consulte la entrada de blog.

Modelos de incrustación de texto más antiguos

Los siguientes modelos antiguos aún son accesibles a través de la API, pero recomendamos usar los modelos nuevos para obtener una mejor calidad y eficiencia.

Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.

Modelo	Longitud del contexto	Dimensiones	Descripción
`voyage-3-large`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Generación anterior de incrustaciones de texto para recuperación de calidad general y multilingüe. Para obtener más información, consulte la entrada de blog.
`voyage-3.5`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Generación anterior de incrustaciones de texto optimizadas para una calidad de recuperación multilingüe y de propósito general. Para obtener más información, consulte la entrada de blog.
`voyage-3.5-lite`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Generación anterior de embeddings de texto optimizada para latencia y costo. Para obtener más información, consulte la entrada de blog.
`voyage-code-2`	16,000 tokens	1536	Optimizada para la recuperación de código (17% mejor que las alternativas). Generación anterior de incrustaciones de código. Para obtener más información, consulte la entrada de blog.

Embeddings de fragmentos contextualizados

Voyage AI proporciona los siguientes modelos que generan incrustaciones al tiempo que incorporan el contexto circundante para mejorar la precisión de recuperación.

Para obtener detalles y ejemplos de uso, consulta Incrustaciones de fragmentos contextualizadas.

Modelo	Longitud del contexto	Dimensiones	Descripción
`voyage-context-3`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Incrustaciones de fragmentos contextualizados optimizados para una calidad de recuperación multilingüe y de propósito general. Para conocer más, consulta la entrada de blog.

Incrustaciones multimodales

Voyage IA proporciona los siguientes modelos de incrustación que procesan texto, imágenes y vídeo.

Para detalles y ejemplos de uso, consulta Multimodal Embeddings.

Modelo	Longitud del contexto	Dimensiones	Descripción
`voyage-multimodal-3.5`	32,000 tokens	1024 (por defecto), 256, 512, 2048	Modelo de incrustación multimodal enriquecido que puede vectorizar texto intercalado y datos visuales, como capturas de pantalla de archivos PDF, diapositivas, tablas, figuras, videos y más. Para obtener más información, consulte la entrada de blog.

Modelos multimodales más antiguos

Los siguientes modelos antiguos aún son accesibles a través de la API, pero recomendamos usar los modelos nuevos para obtener una mejor calidad y eficiencia.

Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.

Modelo	Longitud del contexto	Dimensiones	Descripción
`voyage-multimodal-3`	32,000 tokens	1024	Procesa texto e imágenes en representaciones unificadas. Admite imágenes desde 50,000 hasta 2 millones de píxeles. Para obtener más información, consulte la entrada de blog.

Rerankers

Voyage AI proporciona los siguientes modelos de reclasificación para refinar sus resultados de búsqueda.

Para obtener detalles y ejemplos de uso, consulta Reordenadores.

Modelo	Longitud del contexto	Descripción
`rerank-2.5`	32,000	Precisión más alta. Recomendado para la mayoría de las aplicaciones. Para obtener más información, consulte la entrada de blog.
`rerank-2.5-lite`	32,000	Modelo rápido y rentable optimizado para aplicaciones sensibles a la latencia. Para obtener más información, consulte la entrada de blog.

Reclasificadores antiguos

Los siguientes modelos antiguos aún son accesibles a través de la API, pero recomendamos usar los modelos nuevos para obtener una mejor calidad y eficiencia.

Los últimos modelos superan en rendimiento a los modelos heredados en todos los aspectos, como calidad, longitud de contexto, latencia y rendimiento.

Modelo	Longitud del contexto	Descripción
`rerank-2`	16,000 tokens	Nuestro reranker generalista de segunda generación, optimizado para la calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog.
`rerank-2-lite`	8,000 tokens	Nuestro reranker generalista de segunda generación optimizado tanto para latencia como para calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog.

Precios

La tarificación del modelo se basa en el uso y, los cargos se facturan a la cuenta Atlas vinculada a la clave API utilizada para el acceso. Todos los modelos incluyen un nivel gratuito. Comienza con 200 millones de tokens gratuitos para la mayoría de los modelos o 50 millones de tokens para modelos especializados.

La tarificación se basa en la cantidad de tokens en tus documentos y consultas. El nivel gratuito incluye 200 millones de tokens para la mayoría de los modelos y 50 millones de tokens para los siguientes modelos especializados: voyage-finance-2, voyage-law-2, voyage-code-2.

Modelo	Price per 1K tokens	Price per 1M tokens	Tokens gratuitos
`voyage-4-large`	$0.00012	$0.12	200 millón
`voyage-4`	$0.00006	$0.06	200 millón
`voyage-4-lite`	$0.00002	$0.02	200 millón
`voyage-context-3`	$0.00018	$0.18	200 millón
`voyage-code-3`	$0.00018	$0.18	200 millón
`voyage-finance-2` `voyage-law-2` `voyage-code-2`	$0.00012	$0.12	50 millón

Modelos de incrustación de texto más antiguos

La siguiente tabla muestra los precios de los modelos antiguos de incrustación de texto. No se ofrecen fichas gratuitas para estos modelos.

Modelo	Price per 1K tokens	Price per 1M tokens
`voyage-3-large`	$0.00018	$0.18
`voyage-3.5`	$0.00006	$0.06
`voyage-3.5-lite`	$0.00002	$0.02

El precio se basa en la cantidad de tokens en sus documentos y consultas.

Modelo	Price per 1K tokens	Price per 1M tokens	Tokens gratuitos
`voyage-context-3`	$0.00018	$0.18	200 millón

El precio se basa en tokens de texto y píxeles de imagen. El nivel gratuito incluye 200 millones de tokens de texto y 150 mil millones de píxeles para modelos multimodales. Las imágenes se procesan entre 50,000 píxeles (mínimo) y 2 millones de píxeles (máximo), con costos que varían de $0.00003 a $0.0012 dólares por imagen. Para fines de precios, cada cuadro de video se considera una imagen.

Nota

Las imágenes con menos de 50,000 píxeles se amplían, procesan y cobran como una imagen de 50,000píxeles. Las imágenes que contengan más de 2 millones de píxeles serán reducidas y facturadas como imágenes de 2 millones de píxeles.

Modelo	Price per 1M tokens	Price per 1B pixels	nivel gratuito
`voyage-multimodal-3.5`	$0.12	$0.60	200M tokens, 150B píxeles

Resolución de imagen	Número de píxeles	Preço por imagem	Price per 1K images
200px × 200px	40,000	$0.00003	$0.03
1000px × 1000px	1 millón	$0.0006	$0.60
2000px × 2000px	4 millón	$0.0012	$1.20
4000px × 4000px	16 millón	$0.0012	$1.20

Ejemplo

El costo de vectorizar una sola entrada con 1,000 tokens de texto ($0.00012) y dos imágenes de 4 megapíxeles (2 × $0.0012) sería de $0.00252.

Modelos multimodales más antiguos

La siguiente tabla muestra los precios de los modelos multimodales antiguos. No se ofrecen fichas gratuitas para estos modelos.

Modelo	Price per 1M tokens	Price per 1B pixels	nivel gratuito
`voyage-multimodal-3`	$0.12	$0.60	0

El precio se basa en el total de tokens procesados, calculado como (query tokens × number of documents) + sum of tokens in all documents. El plan gratuito incluye 200 millón de tokens para los modelos de reranking más recientes.

Modelo	Price per 1K tokens	Price per 1M tokens	Est. price per request*	Tokens gratuitos
`rerank-2.5`	$0.00005	$0.05	$0.0025	200 millón
`rerank-2.5-lite`	$0.00002	$0.02	$0.001	200 millón

* El precio estimado asume 100 documentos por solicitud, con la suma de query tokens y tokens por documento que suman un total de 500.

Reclasificadores antiguos

La siguiente tabla muestra los precios para Reclassificadores anteriores. No se ofrecen fichas gratuitas para estos modelos.

Modelo	Price per 1K tokens	Price per 1M tokens	Est. price per request*	Tokens gratuitos
`rerank-2`	$0.00005	$0.05	$0.0025	0
`rerank-2-lite`	$0.00002	$0.02	$0.001	0

Volver

Inicio rápido

API y Clientes