Implementar modelos de IA de Voyage con Google Cloud Model Garden

La API de incrustación y reclasificación está disponible Vista previa. La función y la documentación correspondiente pueden cambiar en cualquier momento durante el período de vista previa.

Puede explorar e implementar modelos de Voyage AI de MongoDB desde Google Cloud Model Garden.

Model Garden administra licencias para los modelos de Voyage AI de MongoDB y brinda opciones de implementación utilizando hardware a pedido o sus reservas existentes de Compute Engine.

Los modelos de Voyage AI de MongoDB son modelos de socios autoimplementados, lo que significa que paga tanto por el uso del modelo como por la infraestructura de Vertex AI utilizada. Vertex AI gestiona la implementación y proporciona funciones de gestión de endpoints.

Modelos disponibles

Para ver qué modelos puedes implementar, busca "Voyage" en Google Cloud Model Garden.

Para obtener más información sobre los modelos de Voyage AI, consulte Descripción general de los modelos.

Precios

Los precios de los modelos de Voyage AI de MongoDB en Google Cloud Model Garden incluyen:

Tarifa de uso del modelo: Costo por usar el contenedor de modelos de Voyage AI, facturado por hora. La tarifa de uso depende del modelo específico y de la configuración de hardware elegida para la implementación. Para obtener información detallada sobre precios, consulte la sección de precios en la página de publicación del modelo en Google Cloud Marketplace.
Instancia subyacente de Google Cloud en tu región: El costo de la instancia subyacente de GPU de Google Cloud (como NVIDIA4 L, A100 o H)100 específica de una región se factura mensualmente y se calcula por vCPU. Para obtener más información, consulta los precios de Google Cloud Compute Engine.

Todos los cargos de facturación aparecen como el uso de Vertex AI en su factura de Google Cloud.

Para ver los precios de un modelo específico de Voyage AI:

Ir al Jardín Modelo.

Busque el modelo.

Busca el modelo en el Model Garden cuadro de búsqueda.

Haga clic en el modelo.

Haga clic en el modelo que desea ver para abrir su página de detalles.

Vaya a la sección de precios.

En la pestaña Overview, desplácese hasta la sección Pricing.

Ver precios detallados.

Haga clic en el enlace que lleva a la ficha del modelo en Google Cloud Marketplace. La pestaña Pricing de la ficha muestra información detallada sobre precios.

Quotas

Al implementar modelos de Voyage AI, se consumen recursos de Vertex AI sujetos a cuotas. Puedes ver y administrar tus cuotas en la Quotas sección de la página IAM de Google Cloud Console. Para obtener más información, consulta "Ver las cuotas de tu proyecto". En la misma página, puedes hacer clic con el botón derecho en cualquier cuota actual, hacer clic en Edit quota y enviar una solicitud para aumentarla si es necesario.

Requisitos previos

Para comenzar a utilizar los modelos de Voyage AI de MongoDB a través de Google Cloud Vertex AI, debes:

Configura un proyecto de Google Cloud y un entorno de desarrollo. Para obtener instrucciones, consulta Configurar tu proyecto y entorno de desarrollo.
Habilite la API Vertex AI. Para obtener instrucciones,consulte Configuración.

Configuración de hardware

Cada modelo del Jardín de Modelos incluye su configuración de hardware recomendada. Consulta el Jardín de Modelos de Google Cloud para Vertex AI para conocer las especificaciones de hardware recomendadas para cada modelo de Voyage.

Por ejemplo, para el modelo voyage-4, utilice las siguientes instancias recomendadas que Vertex AI Model Garden sugiere para la implementación. Estas recomendaciones pueden cambiar, por lo que le recomendamos consultar la página oficial de Google Cloud Model Garden para un modelo Voyage AI específico para ver el hardware recomendado.

A2 instancias, como a2-highgpu-1g o a2-ultragpu-1g, con A100 las GPU son la opción predeterminada.
Se recomiendan instanciasA,3 a3-highgpu-1gcomo, con GPU H para necesidades de mayor rendimiento.100

Regiones admitidas

El Jardín de Modelos enumera las regiones compatibles con cada modelo de Voyage AI. Si necesita asistencia en otra región para alguno de los modelos, contacte con el soporte de MongoDB.

Mejores prácticas y limitaciones

Tipo de punto de conexión: Todos los modelos de IA de Voyage requieren un tipo de punto de conexión público dedicado. Para obtener más información,consulte "Elegir un tipo de punto de conexión".
Comprender input_type: Consulta vs. Documento: El input_type parámetro optimiza las incrustaciones para las tareas de recuperación. Utilice "query" para consultas de búsqueda y "document" para el contenido buscado. Esta optimización mejora la precisión de la recuperación. Para obtener más información sobre el input_type parámetro, consulte la Descripción general de la API de incrustación y reclasificación.
Usar diferentes dimensiones de salida: Los 4 modelos de viaje admiten varias dimensiones de256 512salida:,, 1024 (predeterminado) 2048 y. Las dimensiones más pequeñas reducen los costos de almacenamiento y computación, mientras que las dimensiones más grandes pueden proporcionar mayor precisión. Elija la dimensión que mejor se adapte a sus requisitos de precisión y a las limitaciones de recursos.

Localiza los modelos de IA de Voyage

Para encontrar modelos de Voyage AI de MongoDB en el Jardín de modelos:

Ir al Jardín Modelo.

Vaya a la consola del Jardín Modelo.

Búsqueda de modelos Voyage.

En el campo Search Models, ingrese "Voyage" para mostrar la lista de modelos de Voyage AI de MongoDB.

Nota

Google Cloud Marketplace tiene dos cuadros de búsqueda: uno para todo el Marketplace y otro dentro del sitio Vertex AI Model Garden. Para encontrar los modelos de Voyage AI de MongoDB, utilice el cuadro de búsqueda del sitio Vertex AI Model Garden.

Como alternativa, puede navegar a los modelos de Voyage AI a través de Model Garden > Model Collections > Partner Models y luego seleccionar cualquiera de los Voyage AI modelos enumerados allí.

También puedes desplazarte hacia abajo hasta Task-specific solutions para encontrar modelos de Voyage AI que puedes usar tal como están o personalizar según tus necesidades.

Implementar un modelo de IA de viaje en Vertex AI

Para realizar predicciones con un modelo de Voyage AI de MongoDB, debe implementarlo en un punto de conexión privado dedicado para inferencias en línea. La implementación asocia recursos físicos con un modelo para realizar predicciones en línea de baja latencia y alto rendimiento. Puede implementar varios modelos en un punto de conexión o el mismo modelo en varios.

Al implementar un modelo, considere las siguientes opciones:

Ubicación del punto final
Contenedor modelo
Calcular los recursos necesarios para ejecutar el modelo

Una vez implementado un modelo, no se puede cambiar esta configuración. Si necesita modificar alguna configuración de implementación, debe anular la implementación del modelo y volver a implementarlo con la nueva configuración.

Los modelos de IA de Voyage requieren un punto de conexión público dedicado. Para obtener más información,consulte "Crear un punto de conexión público" en la documentación de Google Cloud Vertex AI.

Para implementar un modelo en Google Cloud Vertex AI usando la consola:

Localiza el modelo.

Vaya a la consola Model Garden y busque "Voyage" en el Search Models campo para mostrar la lista de modelos de Voyage AI de MongoDB.

Haga clic en el modelo que desea implementar para abrir su página de detalles.

Habilite el modelo y acepte el acuerdo.

Haga clic Enable en. Se abrirá el Acuerdo de Usuario Final de MongoDB Marketplace. Revíselo y acéptelo para habilitar el modelo y obtener las licencias de uso comercial necesarias.

Revisar las opciones de implementación.

Después de aceptar el acuerdo, la página del modelo muestra las siguientes opciones:

Deploy a modelGuarda el modelo en el Registro de Modelos y lo implementa en un punto final de Google Cloud. Continúe con los siguientes pasos para implementarlo mediante la consola.
Create an Open Notebook for Voyage Embedding Models FamilyPermite ajustar y personalizar tu modelo en un entorno colaborativo, así como combinar modelos para optimizar el coste y el rendimiento. Consulta los ejemplos de Vertex AI Notebook para Voyage AI.
View CodeMuestra ejemplos de código para implementar y usar el modelo. Para implementar mediante código, consulte Implementar mediante código.

Revisar detalles del modelo.

Revise las regiones del modelo, los requisitos de hardware, las consideraciones, los casos de uso y la información de precios.

Haga clic en Deploy model.

Haga clic en el botón Deploy model para iniciar el proceso de implementación.

Llene el formulario de implementación.

Se abrirá un formulario que le permite revisar y editar las opciones de implementación. Vertex AI proporciona una configuración predeterminada optimizada para el modelo, pero puede personalizarla según sea necesario. Por ejemplo, puede seleccionar el tipo de máquina, el tipo de GPU y el número de réplicas. El siguiente ejemplo muestra la configuración predeterminada para el modelo voyage-4, pero esta puede cambiar, así que revísela detenidamente antes de la implementación.

Campo	Descripción
Resource ID	Seleccione del menú desplegable (preseleccionado).
Model Name	Seleccione del menú desplegable (preseleccionado).
Region	Seleccione la región deseada, como `us-central1`.
Endpoint name	Proporcione un nombre para su punto final, como `mongodb_voyage-4_latest-mg-one-click-deploy`.
Serving spec	Seleccione el tipo de máquina, como `g2-standard-4`.
Accelerator type	Seleccione el tipo de GPU, como `NVIDIA_L4`.
Accelerator count	Especifique el número de GPU, como `1`.
Replica count	Especifique el número mínimo y máximo de réplicas, como `1 - 1`.
Reservation type	Seleccione el tipo de reserva, como `No reservation`.
VM provisioning model	Seleccione el modelo de aprovisionamiento, como `Standard`.
Endpoint access	Seleccione Public (Dedicated endpoint).

Revisar configuración.

Vertex AI optimiza la configuración que se muestra, la cual se aplica de forma predeterminada. Para personalizarla, haz clic en Edit settings. Por ejemplo, puedes seleccionar un tipo de máquina o una GPU más potente.

Check quotas.

La pantalla de configuración muestra las cuotas disponibles. Utilice el enlace a Quotas para administrarlas si es necesario.

Implementar el modelo.

Haga clic en Deploy para iniciar el proceso de implementación.

Espere a que se complete.

Recibirá una notificación cuando se complete la implementación. Una vez completada, puede hacer clic en las listas Google Cloud Vertex AI, Deploy y Endpoints para encontrar su implementación.

Implementar mediante código

Si seleccionó View Code en la página de detalles del modelo, puede implementar un modelo programáticamente con el SDK de Vertex AI. Este enfoque proporciona control total sobre la configuración de la implementación mediante código.

Para obtener más información sobre el SDK de IA Vertex de Google Cloud, consulte la documentación del SDK de IA Vertex para Python.

Nota

Los ejemplos de código de esta sección corresponden al modelo voyage-4 y están sujetos a cambios. Para ver los ejemplos de código más recientes, consulte la pestaña View Code en la página del modelo en el Jardín de Modelos. Para otros modelos de Voyage AI, el código es similar, pero consulte la página de ese modelo en el Jardín de Modelos para obtener detalles específicos.

Para implementar un modelo usando código:

Inicializar el modelo.

Primero, inicialice el modelo desde Model Garden y vea las opciones de implementación:

from vertexai import model_garden
MODEL_NAME = "mongodb/voyage-4@latest"
model = model_garden.OpenModel(MODEL_NAME)
deploy_options = model.list_deploy_options(concise=True)
print(deploy_options)

Implementar en un punto final.

Elija si desea implementar un nuevo modelo o utilizar un punto final existente:

# Choose whether to deploy a new model or use an existing endpoint:
deployment_option = "deploy_new"  # ["deploy_new", "use_existing"]
# If using existing endpoint, provide the endpoint ID:
ENDPOINT_ID = ""  # {type:"string"}
if deployment_option == "deploy_new":
    print("Deploying new model...")
    endpoint = model.deploy(
        machine_type="a3-highgpu-1g",
        accelerator_type="NVIDIA_H100_80GB",
        accelerator_count=1,
        accept_eula=True,
        use_dedicated_endpoint=True,
    )
    print(f"Endpoint deployed: {endpoint.display_name}")
    print(f"Endpoint resource name: {endpoint.resource_name}")
else:
    if not ENDPOINT_ID:
        raise ValueError("Please provide an ENDPOINT_ID when using existing endpoint")
    from google.cloud import aiplatform
    print(f"Connecting to existing endpoint: {ENDPOINT_ID}")
    endpoint = aiplatform.Endpoint(
        endpoint_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/endpoints/{ENDPOINT_ID}"
    )
    print(f"Using endpoint: {endpoint.display_name}")
    print(f"Endpoint resource name: {endpoint.resource_name}")

Importante

Establezca use_dedicated_endpoint en True ya que los modelos de IA de Voyage requieren un punto final público dedicado.

Vertex AI implementa el modelo en un punto final administrado al que puedes acceder para realizar inferencias en línea o por lotes a través de la consola de Google Cloud o la API de Vertex AI.

Para obtener más información, consulte Implementar un modelo en un punto final en la documentación de Google Cloud Vertex AI.

Hacer predicciones.

Después de la implementación, puede realizar predicciones utilizando el punto final Vertex AI.

Para conocer todos los parámetros de puntos finales y las opciones de predicción, consulte la Descripción general de la API de incrustación y reclasificación.

import json
# Multiple texts to embed
texts = [
    "Machine learning enables computers to learn from data.",
    "Natural language processing helps computers understand human language.",
    "Computer vision allows machines to interpret visual information.",
    "Deep learning uses neural networks with multiple layers."
]
# Prepare the batch request and make invoke call
body = {
    "input": texts,
    "output_dimension": 1024,
    "input_type": "document"
}
response = endpoint.invoke(
    request_path="/embeddings",
    body=json.dumps(body).encode("utf-8"),
    headers={"Content-Type": "application/json"}
)
# Extract embeddings
result = response.json()
embeddings = [item["embedding"] for item in result["data"]]
print(f"Number of texts embedded: {len(embeddings)}")
print(f"Embedding dimension: {len(embeddings[0])}")
print(f"\nFirst embedding (first 5 values): {embeddings[0][:5]}")
print(f"Second embedding (first 5 values): {embeddings[1][:5]}")

Anular la implementación de un modelo y eliminar el punto final

Para eliminar un modelo implementado y su punto final:

Anular la implementación del modelo desde el punto final.
Opcionalmente, elimine el punto final en sí.

Para obtener instrucciones detalladas, consulta Anular la implementación de un modelo y eliminar el punto final en la documentación de Google Cloud Vertex AI.

Importante

Puede eliminar el punto de conexión solo después de que se hayan anulado todos los modelos. Al anular la implementación de los modelos y eliminar el punto de conexión, se detendrán todos los servicios de inferencia y la facturación de ese punto de conexión.

Volver

Azure Marketplace