Docs Menu
Docs Home
/ /

Descripción general de la API de incrustación y reclasificación

La API de Integración y Reclasificación proporciona acceso programático a los modelos de integración y reclasificación más recientes de Voyage AI mediante una interfaz RESTful. Esta página ofrece una descripción general de la API y sus funciones.

Para obtener información detallada y parámetros, consulte la especificación API.

Utilice MongoDB Atlas para administrar las claves API de la API de Integración y Reclasificación. Esto incluye la creación y administración de las claves API de su modelo en toda su organización y proyectos, la supervisión del uso y la configuración de límites de velocidad.

Para obtener más información, consulte Claves API del modelo.

Nota

Se denomina clave API de modelo para distinguirla de otras claves API en Atlas. Se utiliza de la misma manera que las claves API de otros proveedores de modelos.

Todas las solicitudes a la API de incrustación y reclasificación deben incluir una Authorization encabezado con su clave API de modelo utilizando el formato de token Bearer.

Authorization: Bearer VOYAGE_API_KEY

Al usar un SDK de cliente, se configura la clave API al crear un cliente, y el SDK envía el encabezado en su nombre con cada solicitud. Al integrar directamente con la API, debe enviar este encabezado usted mismo.

Todas las entidades se representan en JSON. Se aplican las siguientes reglas y convenciones:

Encabezado de solicitud de tipo de contenido
Cuando envíes JSON al servidor con una publicación, especifica el encabezado Content-Type: application/json. Los SDK del cliente gestionan esto automáticamente.
Solicitudes no válidas
Si intenta crear una solicitud con JSON no válido, tipos de datos incorrectos o violaciones de restricciones (como exceder los límites de tokens o tamaños de lote), el servidor responde con un código de estado 400 y un mensaje de error que describe el problema.
Nombres de campos para campos con números
Los campos que contienen valores numéricos se nombran para desambiguar la unidad utilizada. Por ejemplo, los recuentos de tokens se especifican en campos como total_tokens y output_dimension para aclarar la unidad de medida.

La API de Integración y Reclasificación implementa límites de velocidad para garantizar un uso justo y un rendimiento óptimo. Estos límites se aplican por clave API y se miden en dos dimensiones. Los límites de velocidad aumentan a medida que se avanza en los niveles de uso.

  • TPM (Tokens por minuto): Número máximo de tokens procesados ​​por minuto

  • RPM (solicitudes por minuto): número máximo de solicitudes de API por minuto

Si se supera el límite de tasa, la API devuelve un 429 (límite de tasa superado) código de estado HTTP.

Los límites de tarifa de prueba gratuita sin método de pago son 3 RPM y 10K TPM. Para acceder a límites de tarifa más altos, agregue un método de pago a su cuenta.

Modelo
Tokens Per Min (TPM)
Solicitudes por minuto (RPM)

voyage-4-lite, voyage-3.5-lite

16,000,000

2,000

voyage-4, voyage-3.5

8,000,000

2,000

voyage-4-large

3,000,000

2,000

voyage-3-large, voyage-context-3, voyage-code-3, voyage-code-2, voyage-law-2, voyage-finance-2

3,000,000

2,000

voyage-multimodal-3.5, voyage-multimodal-3

2,000,000

2,000

rerank-2-lite, rerank-2.5-lite

4,000,000

2,000

rerank-2, rerank-2.5

2,000,000

2,000

Los límites de velocidad para el nivel de uso 2 son el doble de los del nivel de uso 1.

Modelo
Tokens Per Min (TPM)
Solicitudes por minuto (RPM)

voyage-4-lite, voyage-3.5-lite

32,000,000

4,000

voyage-4, voyage-3.5

16,000,000

4,000

voyage-4-large

6,000,000

4,000

voyage-3-large, voyage-context-3, voyage-code-3, voyage-code-2, voyage-law-2, voyage-finance-2

6,000,000

4,000

voyage-multimodal-3.5, voyage-multimodal-3

4,000,000

4,000

rerank-2-lite, rerank-2.5-lite

8,000,000

4,000

rerank-2, rerank-2.5

4,000,000

4,000

Los límites de velocidad para el nivel de uso 3 son tres veces los del nivel de uso 1.

Modelo
Tokens Per Min (TPM)
Solicitudes por minuto (RPM)

voyage-4-lite, voyage-3.5-lite

48,000,000

6,000

voyage-4, voyage-3.5

24,000,000

6,000

voyage-4-large

9,000,000

6,000

voyage-3-large, voyage-context-3, voyage-code-3, voyage-code-2, voyage-law-2, voyage-finance-2

9,000,000

6,000

voyage-multimodal-3.5, voyage-multimodal-3

6,000,000

6,000

rerank-2-lite, rerank-2.5-lite

12,000,000

6,000

rerank-2, rerank-2.5

6,000,000

6,000

Para obtener más información sobre los niveles de uso, consulte Niveles de uso.

Para establecer límites de velocidad personalizados para su organización, utilice la interfaz de usuario de Atlas. Para obtener más información, consulte Administrar límites de velocidad.

El siguiente ejemplo muestra cómo usar cURL para realizar una solicitud al servicio de incrustación. También puede usar un cliente HTTP en cualquier lenguaje de programación para acceder a la API.

Para obtener ejemplos de uso adicionales, consulte los siguientes recursos:

curl \
--request POST 'https://ai.mongodb.com/v1/embeddings' \
--header "Authorization: Bearer $VOYAGE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
"input": [
"MongoDB is redefining what a database is in the AI era.",
"Voyage AI embedding and reranking models are state-of-the-art."
],
"model": "voyage-4-large"
}'

Para obtener más información sobre los errores devueltos por la API, consulte la especificación de la API.

Tenga en cuenta las siguientes prácticas recomendadas al utilizar la API:

Para tareas de búsqueda y recuperación semántica, configure input_type en query o document para optimizar la creación de vectores por parte de los modelos de Voyage AI. No omita este parámetro.

El parámetro añade las siguientes indicaciones a la entrada antes de generar incrustaciones:

  • query: "Representa la query para recuperar documentos de respaldo: "

  • document: "Representar el documento para su recuperación: "

Ejemplo

input_type="query" transforma "¿Cuándo está programada la conferencia telefónica de Apple?" en "Representa la consulta para recuperar documentos de respaldo: ¿Cuándo está programada la conferencia telefónica de Apple?"

Si usa el cliente de Python, debe usar la versión 0.3.7 o posterior. Para comprobar la versión de su cliente de Python, ejecute el siguiente comando en su terminal:

python -c "import voyageai; print(voyageai.__version__)"

Volver

Revocar token de cuenta de servicio

En esta página