Join us at MongoDB.local London on 7 May to unlock new possibilities for your data. Use WEB50 to save 50%.
Register now >
Docs Menu
Docs Home
/

Acceso a los modelos de IA de Voyage

Puedes acceder a los modelos de Voyage IA utilizando la API de Embedding y Reordenación, que está disponible a través de MongoDB Atlas. Utiliza los siguientes métodos para acceder a la API:

  • REST API: para un acceso agnóstico del lenguaje.

  • Cliente de Python: cliente oficial para facilitar su uso.

Esta página resume cómo acceder a la API. Para obtener detalles completos sobre la API, incluidos los límites de velocidad y los niveles de uso, consulta el Referencia de API.

La API de Integración y Reclasificación utiliza claves API para supervisar el uso y administrar los permisos. Para crear y administrar las claves API de su modelo, utilice la interfaz de usuario de MongoDB Atlas. Para obtener instrucciones, consulte Claves API de modelo.

Los siguientes ejemplos demuestran cómo llamar al servicio de embedding a través de la API REST. La API admite cURL, así como solicitudes HTTP desde cualquier lenguaje de programación.

La autenticación se gestiona a través de la clave API del modelo, que debe incluir en el encabezado de autorización de cada solicitud de API como un token de portador.

Para obtener más información, consulte la especificación completa de la API.

Para instalar el paquete oficial de Python usando pip:

pip install --upgrade voyageai

Utilice la --upgrade -U opción o para instalar la última versión del paquete. Esto le dará acceso a las funciones y correcciones de errores más recientes. Para conocer los parámetros específicos del modelo, consulte los ejemplos de uso de cada página.

Importante

Debe usar la versión 0.3.7 o posterior de la biblioteca cliente de Python. Esta versión añade soporte para la API Embedding and Reranking.

La clase voyageai.Client proporciona una interfaz síncrona para invocar la API de Voyage. Crea un objeto cliente y úsalo para acceder a modelos de IA de Voyage.

Ejemplo

El siguiente ejemplo muestra cómo inicializar el cliente con configuraciones personalizadas y generar embeddings:

import voyageai
# Initialize the client with custom settings
vo = voyageai.Client(
api_key="<model-api-key>", # Or use VOYAGE_API_KEY environment variable
max_retries=3, # Retry up to 3 times on rate limit errors
timeout=30 # Timeout after 30 seconds
)
# Generate embeddings
result = vo.embed(
texts=["MongoDB is redefining what a database is in the AI era."],
model="voyage-4-large"
)
print(f"Embedding dimension: {len(result.embeddings[0])}")
print(f"Total tokens used: {result.total_tokens}")

La siguiente tabla describe los parámetros que se pueden pasar al inicializar el cliente:

Parameter
Tipo
Requerido
Descripción

api_key

String

No

Clave API del modelo. El valor predeterminado es Ninguno.

Si no hay ninguno, el cliente busca la clave API en el siguiente orden:

  • voyageai.api_key_pathruta al archivo que contiene la clave

  • variable de entorno VOYAGE_API_KEY_PATH, que puede configurarse como la ruta al archivo que contiene la clave

  • voyageai.api_key, un atributo del módulo voyageai, que se puede utilizar para almacenar la clave

  • variable de entorno VOYAGE_API_KEY

NOTA: El cliente Python dirige automáticamente las solicitudes al endpoint correcto de la API según el formato de la clave de API:

  • Las claves API del modelo creadas en MongoDB Atlas https://ai.mongodb.com/ se dirigen a los puntos finales.

  • Las claves de API creadas en la plataforma Voyage se enrutan a los endpoints https://api.voyageai.com/.

Puedes anular este comportamiento estableciendo el parámetro base_url al crear el cliente.

max_retries

entero

No

Número máximo de reintentos para cada solicitud de API en caso de errores de límite de velocidad o indisponibilidad temporal del servidor. Por defecto, es 0.

El cliente emplea una estrategia de espera y reintento para gestionar tales errores y genera una excepción al alcanzar el límite máximo de reintentos. Por defecto, el cliente no reintenta.

timeout

entero

No

Tiempo máximo en segundos para esperar una respuesta de la API antes de abortar la solicitud. El valor por defecto es Ninguno.

Si se excede el tiempo de espera especificado, la solicitud se finaliza y se genera una excepción de tiempo de espera. De forma predeterminada, no se aplica ninguna restricción de tiempo de espera.

base_url

String

No

URL base personalizada para las solicitudes de la API. Por defecto, el cliente detecta automáticamente el endpoint correcto según la clave de API proporcionada.

Volver

Modelos

En esta página