Puedes usar Aplicaciones gestionadas de Azure para implementar modelos Voyage AI como puntos finales de API de inferencia en tiempo real en una cuenta de cliente de Azure y red virtual (VNet). Las aplicaciones administradas de Azure ofrecen los siguientes beneficios clave:
Flujo de datos y control de acceso: Los datos nunca abandonan tu red virtual, abordando los riesgos de privacidad de los datos asociados con la gestión por parte de terceros o en entornos multiusuario.
Fiabilidad y cumplimiento respaldados por Azure: Azure sirve como su único subprocesador, por lo que usted hereda todas las garantías de confiabilidad y cumplimiento de Azure.
Facturación y pago a través de Azure: Al utilizar tu información de facturación y créditos existentes de Azure para adquirir modelos de Voyage IA, no necesitas gestionar un sistema de pago y facturación de terceros por separado.
Modelos disponibles
Para ver qué modelos se pueden implementar, busca "Voyage IA by MongoDB" en Azure Marketplace.
Para obtener más información sobre los modelos de Voyage AI, consulte Descripción general de los modelos.
Precios
Las aplicaciones gestionadas de Azure que utilizan modelos Voyage IA se facturan por hora. El costo total por hora es la suma del precio de la máquina virtual (VM) ($5 por hora) y el precio de la instancia subyacente en tu región. No hay costo de gestión para esta aplicación gestionada de Azure, por lo que el precio mensual enumerado de la aplicación gestionada de Azure es de $0.
Requisitos previos
Para implementar una aplicación administrada de Voyage Azure, debes tener lo siguiente:
Una red virtual existente para implementar una aplicación gestionada de Voyage en Azure. Para obtener instrucciones, consulte la sección Crear una red virtual.
Cuota suficiente de GPU vCPU para la familia de instancias requerida por su aplicación administrada de Voyage Azure seleccionada. Para aprender a comprobar tu cuota o solicitar un aumento de cuota, consulta la sección Cuota .
Si cumples con todos los requisitos previos, salta a la sección Implementar un endpoint de API de Voyage en Virtual Network.
Quota
Esta sección incluye orientación sobre cómo verificar tu cuota y solicitar un aumento si es necesario. Si cuentas con una cuota suficiente, omite esta sección.
Check Quota
Vaya a Suscripciones en su portal de Azure.
Buscar cuota.
Busca la familia de instancias de GPU necesaria para tu aplicación administrada de Azure seleccionada Voyage en la barra de búsqueda. Por ejemplo, Standard_NC40ads_H100_v5 o Standard_NC24ads_A100_v4. Filtra la Región para tu región deseada; en el ejemplo de abajo, filtramos la región para "Oeste de EE. UU. 2".
Verify quota.
Asegúrese de contar con una cuota suficiente de GPU vCPU para la cantidad de aplicaciones gestionadas de Voyage en Azure que desea implementar. Si no tienes una cuota suficiente, continúa a la siguiente sección (Solicitar aumento de cuota) para solicitar más cuota.
Solicitar incremento de límite
Desde la página de Uso + cuotas de tu suscripción deseada, puedes solicitar un aumento de tu cuota:
Selecciona la cuota.
Marque la casilla de verificación de la cuota de la familia de instancias de GPU requerida por la aplicación administrada de Azure Voyage que haya elegido. Seleccione la lista desplegable Nueva solicitud de cuota y elija Ingresar un nuevo límite. Aparecerá un panel de Solicitud de cuota nueva.
Crear una red virtual
Si ya cuenta con una red virtual existente en la que desea implementar su aplicación gestionada de Voyage Azure, puede omitir esta sección.
Completa la pestaña de fundamentos.
Completa los campos en la pestaña Básicos.
Campo | Valor |
|---|---|
Suscripción | Selecciona tu suscripción. |
Grupo de recursos | Selecciona un grupo de recursos existente o crea un nuevo grupo de recursos. |
Nombre de la red virtual | Proporcione un nombre para su red virtual. |
Región | Selecciona tu región deseada. Esta región debe tener la cuota de recursos requerida. |
Configura los ajustes avanzados.
Existen varias configuraciones avanzadas, como la seguridad, las direcciones IP y las etiquetas. Si tienes requisitos avanzados de configuración, introdúcelos en las pestañas correspondientes. Voyage no requiere ninguna configuración avanzada para implementar nuestra aplicación. Si no necesitas ninguna configuración avanzada o no sabes, haz clic en Revisar + crear para revisar y crear directamente tu aplicación.
Implementa un punto final de API de Voyage en red virtual
En esta sección, implementas una aplicación administrada de Voyage Azure en tu red virtual.
Selecciona la aplicación.
Selecciona la aplicación gestionada de Voyage Azure a la que te gustaría suscribir en el Azure Marketplace.
Completa la pestaña de fundamentos.
Completa los campos en la pestaña Básicos. Haz clic en Siguiente para continuar con Configuración de red.
Campo | Valor |
|---|---|
Suscripción | Selecciona tu suscripción. |
Grupo de recursos | Selecciona el grupo de recursos que contenga la red virtual deseada. |
Región | Selecciona tu región deseada. Esta región debe tener la cuota de recursos requerida. |
Nombre de la aplicación | Proporcione un nombre para su aplicación. |
Managed Resource Group | Proporciona un nombre para tu grupo de recursos administrados. |
Complete la pestaña Configuración de red.
Completa los campos en la pestaña Configuración de red. Una vez que termine, haga clic en Siguiente.
Campo | Valor |
|---|---|
Seleccione una red virtual existente (no cree una nueva vnet) | Seleccione su red virtual existente deseada. El endpoint de la API de Voyage se implementará en esta red virtual. |
Selecciona o crea una subred que permita tráfico HTTP | Selecciona la subred deseada. Selecciona "por defecto" si no tienes subredes personalizadas o avanzadas dentro de tu red virtual. El endpoint de la API Voyage desplegado tendrá una IP privada dentro de esta subred. |
Obtenga la dirección IP privada.
Desde la página de recursos de la aplicación, obtén la IP privada del punto final haciendo clic en Parámetros y Resultados en la sección Configuración. Tome nota de la IP privada (salida "privateIPAddress"); necesitará esta dirección IP para invocar los endpoints de la aplicación.
Si necesita ayuda para implementar un punto final de API de Voyage desde el Mercado Azure, contacte con el soporte de MongoDB.
Acceso a los puntos finales de la API de Voyage
Una vez implementados, los endpoints de la API de Voyage pueden ser accedidos a través de solicitudes HTTP por cualquier servicio dentro de la misma red virtual.
Crear una máquina virtual Bastion
Para demostrar cómo acceder a los puntos de conexión de la API de Voyage, crearemos una máquina virtual de bastión dentro de la misma red virtual. Si deseas utilizar u otros ordenadores/servidores ya existentes en la red para query los puntos finales de los modelos, puedes omitir esta sección e ir directamente a la sección de Invocar Endpoint de la API de Voyage.
Este procedimiento te guía a través de una configuración de máquina virtual de bajo costo solo para fines de demostración. Si eres un usuario avanzado, puedes realizar configuraciones personalizadas.
conceptos básicos
Completa los campos en la pestaña Básicos. Una vez completado, haz clic en Siguiente.
Campo | Valor |
|---|---|
Suscripción | Selecciona tu suscripción. |
Grupo de recursos | Selecciona el grupo de recursos que contiene tu endpoint de la API de Voyage. |
Nombre de la máquina virtual | Proporcione un nombre para su máquina virtual. |
Región | Selecciona la región de tu endpoint de la API de Voyage. |
Opciones de disponibilidad | Selecciona "No se requiere redundancia de infraestructura" |
Tipo de seguridad | Seleccione "Estándar". |
Imagen | Selecciona "Ubuntu servidor 24.04 LTS - x64 Gen2". |
Arquitectura de VM | Selecciona "x64". |
Ejecutar con el descuento Azure Spot | Deja la casilla sin marcar. |
Tamaño | Selecciona "Standard_B1s - 1 vcpu, 1GiB de memoria". |
Habilitar hibernación | Deja la casilla sin marcar. |
Tipo de autenticación | Selecciona "llave pública SSH". |
Nombre de usuario | Ingrese "viaje". |
Fuente de clave pública SSH | Selecciona "Generar nuevo par de llaves". |
Tipo de clave SSH | Selecciona "Formato RSA SSH". |
Nombre del par de claves | Introduzca "vm-voyage_key". |
Puertos de entrada públicos | Seleccionar "Permitir puertos seleccionados". |
Seleccionar puertos de enlace | Seleccionar "SSH (22)". |
Discos
Rellene los campos en la pestaña Discos. Una vez completado, haz clic en Siguiente para pasar a Redes.
Campo | Valor |
|---|---|
Cifrado en el host | Deja la casilla sin marcar. |
OS disk size | Selecciona "Por defecto de imagen (30 GiB)". |
OS disk type | Seleccione "HDD estándar (almacenamiento con redundancia local)". |
Borrar con VM | Marca la casilla. |
Gestión de claves | Selecciona “Clave gestionada por la plataforma”. |
Activar la compatibilidad con Ultra Disk | Deja la casilla sin marcar. |
Gestión de redes
Rellene los campos en la pestaña Networking. Una vez que hayas terminado, haz clic en Revisión y creación.
Campo | Valor |
|---|---|
Red virtual | IMPORTANTE. Selecciona la red virtual en la que se implementa el punto final de la API de Voyage. |
Subred | IMPORTANTE. Selecciona la subred dentro de la red virtual en la que está implementado tu extremo API de Voyage. |
IP pública | IMPORTANTE. Crea una nueva IP pública. Si no se crea esto, no podrá acceder a su máquina virtual desde fuera de la red virtual. |
Grupo de seguridad de red NIC | Selecciona "Básico". |
Puertos de entrada públicos | Seleccionar "Permitir puertos seleccionados". |
Seleccionar puertos de enlace | Seleccionar "SSH (22)". |
Borrar IP pública y NIC cuando se elimine la máquina virtual | Deja la casilla sin marcar. |
Habilitar la red acelerada | Deja la casilla sin marcar. |
Opciones de equilibrio de carga | Selecciona "Ninguno". |
Revisar y crear
Verificar la creación.
Verifique la creación de su máquina virtual bastión. Mientras se está creando, verá el estado como "La implementación está en progreso". Verás el estado cambiar a "Tu implementación está completa" cuando tu máquina virtual bastión haya sido creada exitosamente. Haz clic en Ir al recurso para obtener la dirección IP pública de tu máquina virtual bastión.
Invocar el punto final de la API de Voyage
Verifica que la API sea accesible.
Verifica que la API de Voyage sea accesible con el siguiente endpoint:
curl -X GET http://10.0.0.4/info
{"model":"voyage-4","model_loaded":true,"tokenizer_initialized":true,"loading_status":"completed","gpu_info":{"count":1,"memory_allocated_mb":XXX,"memory_reserved_mb": XXX}}
Haz una solicitud.
Puedes hacer una solicitud a la API de Voyage con el siguiente endpoint: http://{voyage-app-vnet-private-ip}/embeddings.
curl -X GET "http://10.0.0.4/embeddings" \ -H "Content-Type: application/json" \ -d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}
Para conocer todos los parámetros de endpoint, consulte la Referencia de API.
Borrar una aplicación de API de Voyage
Para eliminar tu endpoint de la API de Voyage, ve a tu aplicación y haz clic en el botón borrar en la sección Información General. En el cuadro de diálogo que aparece, haz clic en Sí para confirmar la eliminación. Esto también borra el grupo de recursos administrados asociado.
Borrar la Máquina Virtual Bastion
Si has aprovisionado una máquina virtual de bastión, bórrala para evitar incurrir en costos innecesarios y cargos inesperados.
Confirmar eliminación.
En el panel de eliminación, asegúrese de eliminar todos los recursos de la máquina virtual marcando todas las casillas que aparecen en la captura de pantalla a continuación: Aplicar eliminación forzada, Disco del SO, Interfaces de red, Direcciones IP públicas. Marca la casilla de reconocimiento: "He leído y entendido que esta máquina virtual, así como los recursos asociados seleccionados que se mencionan arriba, se borrarán." Finalmente, haz clic en Borrar.