Join us at MongoDB.local London on 7 May to unlock new possibilities for your data. Use WEB50 to save 50%.
Register now >
Docs Menu
Docs Home
/

Implementar modelos de Voyage AI usando Azure Marketplace

Puedes usar Aplicaciones gestionadas de Azure para implementar modelos Voyage AI como puntos finales de API de inferencia en tiempo real en una cuenta de cliente de Azure y red virtual (VNet). Las aplicaciones administradas de Azure ofrecen los siguientes beneficios clave:

  1. Flujo de datos y control de acceso: Los datos nunca abandonan tu red virtual, abordando los riesgos de privacidad de los datos asociados con la gestión por parte de terceros o en entornos multiusuario.

  2. Fiabilidad y cumplimiento respaldados por Azure: Azure sirve como su único subprocesador, por lo que usted hereda todas las garantías de confiabilidad y cumplimiento de Azure.

  3. Facturación y pago a través de Azure: Al utilizar tu información de facturación y créditos existentes de Azure para adquirir modelos de Voyage IA, no necesitas gestionar un sistema de pago y facturación de terceros por separado.

Para ver qué modelos se pueden implementar, busca "Voyage IA by MongoDB" en Azure Marketplace.

Para obtener más información sobre los modelos de Voyage AI, consulte Descripción general de los modelos.

Las aplicaciones gestionadas de Azure que utilizan modelos Voyage IA se facturan por hora. El costo total por hora es la suma del precio de la máquina virtual (VM) ($5 por hora) y el precio de la instancia subyacente en tu región. No hay costo de gestión para esta aplicación gestionada de Azure, por lo que el precio mensual enumerado de la aplicación gestionada de Azure es de $0.

Para implementar una aplicación administrada de Voyage Azure, debes tener lo siguiente:

  • Una suscripción a Azure existente.

  • Una red virtual existente para implementar una aplicación gestionada de Voyage en Azure. Para obtener instrucciones, consulte la sección Crear una red virtual.

  • Cuota suficiente de GPU vCPU para la familia de instancias requerida por su aplicación administrada de Voyage Azure seleccionada. Para aprender a comprobar tu cuota o solicitar un aumento de cuota, consulta la sección Cuota .

Si cumples con todos los requisitos previos, salta a la sección Implementar un endpoint de API de Voyage en Virtual Network.

Esta sección incluye orientación sobre cómo verificar tu cuota y solicitar un aumento si es necesario. Si cuentas con una cuota suficiente, omite esta sección.

1
2

Selecciona la suscripción que deseas usar para la aplicación administrada de Azure. En el ejemplo siguiente, seleccionamos la suscripción "pago basado en uso". Dentro de tu página de Suscripciones, selecciona Uso y cuotas en Configuración.

3

Busca la familia de instancias de GPU necesaria para tu aplicación administrada de Azure seleccionada Voyage en la barra de búsqueda. Por ejemplo, Standard_NC40ads_H100_v5 o Standard_NC24ads_A100_v4. Filtra la Región para tu región deseada; en el ejemplo de abajo, filtramos la región para "Oeste de EE. UU. 2".

4

Asegúrese de contar con una cuota suficiente de GPU vCPU para la cantidad de aplicaciones gestionadas de Voyage en Azure que desea implementar. Si no tienes una cuota suficiente, continúa a la siguiente sección (Solicitar aumento de cuota) para solicitar más cuota.

Desde la página de Uso + cuotas de tu suscripción deseada, puedes solicitar un aumento de tu cuota:

1

Marque la casilla de verificación de la cuota de la familia de instancias de GPU requerida por la aplicación administrada de Azure Voyage que haya elegido. Seleccione la lista desplegable Nueva solicitud de cuota y elija Ingresar un nuevo límite. Aparecerá un panel de Solicitud de cuota nueva.

2

En el panel Nueva solicitud de cuota, introduce la cuota que deseas en el campo Nuevo límite. Click enviar.

Si ya cuenta con una red virtual existente en la que desea implementar su aplicación gestionada de Voyage Azure, puede omitir esta sección.

1
2

Busca "red virtual". Seleccione Red virtual de los resultados.

3
4

Completa los campos en la pestaña Básicos.

Campo
Valor

Suscripción

Selecciona tu suscripción.

Grupo de recursos

Selecciona un grupo de recursos existente o crea un nuevo grupo de recursos.

Nombre de la red virtual

Proporcione un nombre para su red virtual.

Región

Selecciona tu región deseada. Esta región debe tener la cuota de recursos requerida.

5

Existen varias configuraciones avanzadas, como la seguridad, las direcciones IP y las etiquetas. Si tienes requisitos avanzados de configuración, introdúcelos en las pestañas correspondientes. Voyage no requiere ninguna configuración avanzada para implementar nuestra aplicación. Si no necesitas ninguna configuración avanzada o no sabes, haz clic en Revisar + crear para revisar y crear directamente tu aplicación.

6

En la pestaña Revisar + crear, revise su configuración y haga clic en Crear para confirmar. De lo contrario, haz clic en el botón Anterior o en las pestañas correspondientes para realizar cambios.

7

Comprueba la creación de tu red virtual. Mientras se crea, verá el estado como "La implementación está en progreso".

Verás que el estado cambia a "Tu implementación está completa" cuando se haya creado correctamente tu red virtual.

En esta sección, implementas una aplicación administrada de Voyage Azure en tu red virtual.

1

Selecciona la aplicación gestionada de Voyage Azure a la que te gustaría suscribir en el Azure Marketplace.

2
3
4

Crea una Aplicación gestionada de Azure con plan estándar seleccionando tu suscripción y el "Plan estándar" de los menús desplegables y haciendo clic en Crear.

5

Completa los campos en la pestaña Básicos. Haz clic en Siguiente para continuar con Configuración de red.

Campo
Valor

Suscripción

Selecciona tu suscripción.

Grupo de recursos

Selecciona el grupo de recursos que contenga la red virtual deseada.

Región

Selecciona tu región deseada. Esta región debe tener la cuota de recursos requerida.

Nombre de la aplicación

Proporcione un nombre para su aplicación.

Managed Resource Group

Proporciona un nombre para tu grupo de recursos administrados.

6

Completa los campos en la pestaña Configuración de red. Una vez que termine, haga clic en Siguiente.

Campo
Valor

Seleccione una red virtual existente (no cree una nueva vnet)

Seleccione su red virtual existente deseada. El endpoint de la API de Voyage se implementará en esta red virtual.

Selecciona o crea una subred que permita tráfico HTTP

Selecciona la subred deseada. Selecciona "por defecto" si no tienes subredes personalizadas o avanzadas dentro de tu red virtual. El endpoint de la API Voyage desplegado tendrá una IP privada dentro de esta subred.

7

En la pestaña Revisar + crear, revise su configuración y haga clic en Crear para confirmar. De lo contrario, haz clic en el botón Anterior o en las pestañas correspondientes para realizar cambios.

8

Verifica la creación de tu endpoint de la API de Voyage. Mientras se crea, verá el estado como "La implementación está en progreso."

9

Verás que el estado cambia a "Tu implementación está completa" cuando tu punto de enlace de la API de Voyage se haya creado con éxito.

Importante

Haz clic en Ir a recurso para ver las propiedades de la aplicación.

10

Desde la página de recursos de la aplicación, obtén la IP privada del punto final haciendo clic en Parámetros y Resultados en la sección Configuración. Tome nota de la IP privada (salida "privateIPAddress"); necesitará esta dirección IP para invocar los endpoints de la aplicación.

Si necesita ayuda para implementar un punto final de API de Voyage desde el Mercado Azure, contacte con el soporte de MongoDB.

Una vez implementados, los endpoints de la API de Voyage pueden ser accedidos a través de solicitudes HTTP por cualquier servicio dentro de la misma red virtual.

Para demostrar cómo acceder a los puntos de conexión de la API de Voyage, crearemos una máquina virtual de bastión dentro de la misma red virtual. Si deseas utilizar u otros ordenadores/servidores ya existentes en la red para query los puntos finales de los modelos, puedes omitir esta sección e ir directamente a la sección de Invocar Endpoint de la API de Voyage.

1

Desde la página de inicio del portal de Azure, haz clic en Crear un recurso.

2

Buscar "máquina virtual". Selecciona Máquina virtual en los resultados.

3

Este procedimiento te guía a través de una configuración de máquina virtual de bajo costo solo para fines de demostración. Si eres un usuario avanzado, puedes realizar configuraciones personalizadas.

Completa los campos en la pestaña Básicos. Una vez completado, haz clic en Siguiente.

Campo
Valor

Suscripción

Selecciona tu suscripción.

Grupo de recursos

Selecciona el grupo de recursos que contiene tu endpoint de la API de Voyage.

Nombre de la máquina virtual

Proporcione un nombre para su máquina virtual.

Región

Selecciona la región de tu endpoint de la API de Voyage.

Opciones de disponibilidad

Selecciona "No se requiere redundancia de infraestructura"

Tipo de seguridad

Seleccione "Estándar".

Imagen

Selecciona "Ubuntu servidor 24.04 LTS - x64 Gen2".

Arquitectura de VM

Selecciona "x64".

Ejecutar con el descuento Azure Spot

Deja la casilla sin marcar.

Tamaño

Selecciona "Standard_B1s - 1 vcpu, 1GiB de memoria".

Habilitar hibernación

Deja la casilla sin marcar.

Tipo de autenticación

Selecciona "llave pública SSH".

Nombre de usuario

Ingrese "viaje".

Fuente de clave pública SSH

Selecciona "Generar nuevo par de llaves".

Tipo de clave SSH

Selecciona "Formato RSA SSH".

Nombre del par de claves

Introduzca "vm-voyage_key".

Puertos de entrada públicos

Seleccionar "Permitir puertos seleccionados".

Seleccionar puertos de enlace

Seleccionar "SSH (22)".

Rellene los campos en la pestaña Discos. Una vez completado, haz clic en Siguiente para pasar a Redes.

Campo
Valor

Cifrado en el host

Deja la casilla sin marcar.

OS disk size

Selecciona "Por defecto de imagen (30 GiB)".

OS disk type

Seleccione "HDD estándar (almacenamiento con redundancia local)".

Borrar con VM

Marca la casilla.

Gestión de claves

Selecciona “Clave gestionada por la plataforma”.

Activar la compatibilidad con Ultra Disk

Deja la casilla sin marcar.

Rellene los campos en la pestaña Networking. Una vez que hayas terminado, haz clic en Revisión y creación.

Campo
Valor

Red virtual

IMPORTANTE. Selecciona la red virtual en la que se implementa el punto final de la API de Voyage.

Subred

IMPORTANTE. Selecciona la subred dentro de la red virtual en la que está implementado tu extremo API de Voyage.

IP pública

IMPORTANTE. Crea una nueva IP pública. Si no se crea esto, no podrá acceder a su máquina virtual desde fuera de la red virtual.

Grupo de seguridad de red NIC

Selecciona "Básico".

Puertos de entrada públicos

Seleccionar "Permitir puertos seleccionados".

Seleccionar puertos de enlace

Seleccionar "SSH (22)".

Borrar IP pública y NIC cuando se elimine la máquina virtual

Deja la casilla sin marcar.

Habilitar la red acelerada

Deja la casilla sin marcar.

Opciones de equilibrio de carga

Selecciona "Ninguno".

1

En la pestaña Revisar + crear, revise su configuración y haga clic en Crear para confirmar. De lo contrario, haz clic en el botón Anterior o en las pestañas correspondientes para realizar cambios.

2

Aparece un nuevo modal para Generar un nuevo par de claves. Haz clic en Descargar clave privada y crear recurso para guardar la clave en tu equipo local. Tome nota de dónde guardó la clave.

3

Verifique la creación de su máquina virtual bastión. Mientras se está creando, verá el estado como "La implementación está en progreso". Verás el estado cambiar a "Tu implementación está completa" cuando tu máquina virtual bastión haya sido creada exitosamente. Haz clic en Ir al recurso para obtener la dirección IP pública de tu máquina virtual bastión.

4

En la página de su máquina virtual de bastion, puede encontrar la dirección IP pública en la sección Descripción general, bajo Imprescindibles.

5

Actualiza los permisos de la clave privada SSH que descargaste para que sea solo de lectura:

chmod 400 vm-voyage_key.pem
6

Iniciar sesión de forma segura en el shell de la máquina virtual de bastión (SSH) utilizando la clave privada. El formato es: ssh -i {private-ssh-key} voyage@{bastion-vm-public-ip-address}. Por ejemplo: ssh -i vm-voyage_key.pem voyage@52.143.109.43.

1

Verifica que la API de Voyage sea accesible con el siguiente endpoint:

curl -X GET http://10.0.0.4/info
{"model":"voyage-4","model_loaded":true,"tokenizer_initialized":true,"loading_status":"completed","gpu_info":{"count":1,"memory_allocated_mb":XXX,"memory_reserved_mb": XXX}}
2

Puedes hacer una solicitud a la API de Voyage con el siguiente endpoint: http://{voyage-app-vnet-private-ip}/embeddings.

curl -X GET "http://10.0.0.4/embeddings" \
-H "Content-Type: application/json" \
-d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}

Para conocer todos los parámetros de endpoint, consulte la Referencia de API.

Para eliminar tu endpoint de la API de Voyage, ve a tu aplicación y haz clic en el botón borrar en la sección Información General. En el cuadro de diálogo que aparece, haz clic en para confirmar la eliminación. Esto también borra el grupo de recursos administrados asociado.

Si has aprovisionado una máquina virtual de bastión, bórrala para evitar incurrir en costos innecesarios y cargos inesperados.

1

Vaya a su máquina virtual de bastión y haga clic en el botón borrar en la sección Descripción general. Aparece un panel de eliminación.

2

En el panel de eliminación, asegúrese de eliminar todos los recursos de la máquina virtual marcando todas las casillas que aparecen en la captura de pantalla a continuación: Aplicar eliminación forzada, Disco del SO, Interfaces de red, Direcciones IP públicas. Marca la casilla de reconocimiento: "He leído y entendido que esta máquina virtual, así como los recursos asociados seleccionados que se mencionan arriba, se borrarán." Finalmente, haz clic en Borrar.

Volver

AWS Marketplace

En esta página