Puede utilizar aplicaciones administradas de Azure Implementar modelos de IA de Voyage como puntos de conexión de API de inferencia en tiempo real en una cuenta de Azure y una red virtual (VNet) de un cliente. Las aplicaciones administradas por Azure ofrecen las siguientes ventajas clave:
Flujo de datos y control de acceso: los datos nunca abandonan su red virtual, lo que aborda los riesgos de privacidad de datos asociados con el servicio de terceros o de múltiples inquilinos.
Confiabilidad y cumplimiento respaldados por Azure: Azure actúa como su único subprocesador, por lo que hereda todas las garantías de confiabilidad y cumplimiento de Azure.
Facturación y pago a través de Azure: al usar su información de facturación y créditos de Azure existentes para comprar modelos de Voyage AI, no necesita administrar un sistema de facturación y pago de terceros independiente.
Modelos disponibles
Para ver qué modelos puedes implementar, busca "Voyage AI by MongoDB" en Azure Marketplace.
Para obtener más información sobre los modelos de Voyage AI, consulte Descripción general de los modelos.
Precios
Las aplicaciones administradas de Azure que utilizan modelos de Voyage AI se facturan por hora. El coste total por hora es la suma del precio de la máquina virtual (VM) (5 $ por hora) y el precio de la instancia subyacente en su región. Esta aplicación administrada de Azure no tiene coste de administración, por lo que el precio mensual indicado es de 0$.
Requisitos previos
Para implementar una aplicación administrada de Voyage Azure, debe tener lo siguiente:
Una red virtual existente para implementar una aplicación administrada por Azure Voyage. Para obtener instrucciones, consulte la sección "Crear una red virtual".
Cuota de vCPU de GPU suficiente para la familia de instancias que requiere la aplicación administrada de Azure Voyage elegida. Para saber cómo consultar su cuota o solicitar un aumento, consulte la sección Cuota.
Si cumple con todos los requisitos previos, pase a la sección Implementar un punto final de API de Voyage en una red virtual.
Quota
Esta sección incluye instrucciones sobre cómo consultar su cuota y solicitar un aumento si es necesario. Si tiene suficiente cuota, omita esta sección.
Check Quota
Vaya a Suscripciones en su portal de Azure.
Búsqueda de cuota.
Busque la familia de instancias de GPU que requiere la aplicación administrada de Azure Voyage en la barra de búsqueda. Por ejemplo, Standard_NC40ads_H100_v5 Standard_NC24ads_A100_v4o. Filtra la región según la que desees; en el ejemplo a continuación, filtramos la región por "Oeste de 2 EE. UU. ".
Solicitar aumento de cuota
Desde la página Uso + cuotas de la suscripción deseada, puedes solicitar aumentar tu cuota:
Crear una red virtual
Si ya tiene una red virtual existente en la que desea implementar su aplicación administrada Voyage de Azure, omita esta sección.
Complete la pestaña Información básica.
Complete los campos en la pestaña Básico.
Campo | Valor |
|---|---|
Suscripción | Seleccione su suscripción. |
Grupo de recursos | Seleccione un grupo de recursos existente o cree uno nuevo. |
Nombre de red virtual | Proporcione un nombre para su red virtual. |
Región | Seleccione la región deseada. Esta región debe tener la cuota de recursos requerida. |
Configurar ajustes avanzados.
Existen varias configuraciones avanzadas, como seguridad, direcciones IP y etiquetas. Si tiene requisitos de configuración avanzados, introdúzcalos en las pestañas correspondientes. Voyage no requiere ninguna configuración avanzada para implementar nuestra aplicación. Si no necesita ninguna configuración avanzada o no la conoce, haga clic en "Revisar y crear" para revisar y crear directamente su aplicación.
Implementar un punto final de la API de Voyage en una red virtual
En esta sección, implementará una aplicación administrada de Voyage Azure en su red virtual.
Seleccione la aplicación.
Selecciona la aplicación gestionada de Voyage Azure a la que te gustaría suscribir en el Azure Marketplace.
Complete la pestaña Información básica.
Complete los campos de la pestaña "Configuración básica".Haga clic en "Siguiente" para ir a "Configuración de red".
Campo | Valor |
|---|---|
Suscripción | Seleccione su suscripción. |
Grupo de recursos | Seleccione el grupo de recursos que contiene la red virtual deseada. |
Región | Seleccione la región deseada. Esta región debe tener la cuota de recursos requerida. |
Nombre de la aplicación | Proporcione un nombre para su aplicación. |
Managed Resource Group | Proporcione un nombre para su grupo de recursos administrados. |
Complete la pestaña Configuración de red.
Complete los campos de la pestaña Configuración de red. Una vez completados, haga clic en Siguiente.
Campo | Valor |
|---|---|
Seleccione una red virtual existente (no cree una nueva vnet) | Seleccione la red virtual existente que desee. El punto final de la API de Voyage se implementará en esta red virtual. |
Seleccione o cree una subred que permita el tráfico HTTP | Selecciona la subred deseada. Selecciona "por defecto" si no tienes subredes personalizadas o avanzadas dentro de tu red virtual. El endpoint de la API Voyage desplegado tendrá una IP privada dentro de esta subred. |
Si necesita ayuda para implementar un punto final de API de Voyage desde Azure Marketplace, comuníquese con el soporte técnico de MongoDB.
Acceso a los puntos finales de la API de Voyage
Una vez implementados, se puede acceder a los puntos finales de la API de Voyage a través de solicitudes HTTP por cualquier servicio dentro de la misma red virtual.
Crear una máquina virtual Bastion
Para demostrar cómo acceder a los puntos de conexión de la API de Voyage, crearemos una máquina virtual bastión dentro de la misma red virtual. Si desea usar o tener otras máquinas/servidores en la red para consultar los puntos de conexión del modelo, puede omitir esta sección y pasar directamente a la sección "Invocar punto de conexión de la API de Voyage".
Este procedimiento le guiará a través de la configuración de una máquina virtual de bajo costo, solo para fines de demostración. Si es un usuario avanzado, puede crear configuraciones personalizadas.
Conceptos básicos
Complete los campos de la pestaña "Configuración básica". Una vez completados, haga clic en "Siguiente".
Campo | Valor |
|---|---|
Suscripción | Seleccione su suscripción. |
Grupo de recursos | Seleccione el grupo de recursos que contiene su punto final de API de Voyage. |
Nombre de la máquina virtual | Proporcione un nombre para su máquina virtual. |
Región | Seleccione la región del punto final de su API de Voyage. |
Opciones de disponibilidad | Seleccione "No se requiere redundancia de infraestructura" |
Tipo de seguridad | Seleccione "Estándar". |
Imagen | Seleccione "Ubuntu Server 24.04 LTS - x64 Gen2". |
Arquitectura de máquina virtual | Seleccione "x64". |
Ejecute con descuento de Azure Spot | Deje la casilla sin marcar. |
Tamaño | Seleccione "Standard_B1s - 1 vcpu, 1GiB de memoria". |
Habilitar hibernación | Deje la casilla sin marcar. |
Tipo de autenticación | Seleccione "Clave pública SSH". |
Nombre de usuario | Introduzca "viaje". |
Fuente de clave pública SSH | Seleccione "Generar nuevo par de claves". |
Tipo de clave SSH | Seleccione "Formato RSA SSH". |
Nombre del par de claves | Introduzca "vm-voyage_key". |
Puertos públicos de entrada | Seleccione "Permitir puertos seleccionados". |
Seleccionar puertos de entrada | Seleccione "SSH (22)". |
Discos
Complete los campos de la pestaña Discos. Una vez completados,haga clic en Siguiente para pasar a Redes.
Campo | Valor |
|---|---|
Cifrado en el host | Deje la casilla sin marcar. |
OS disk size | Seleccione "Imagen predeterminada (30 GiB)". |
OS disk type | Seleccione "HDD estándar (almacenamiento con redundancia local)". |
Eliminar con VM | Marcar la casilla. |
Gestión de claves | Seleccione "Clave administrada por la plataforma". |
Habilitar la compatibilidad con Ultra Disk | Deje la casilla sin marcar. |
Gestión de redes
Complete los campos de la pestaña Redes. Una vez completados, haga clic en Revisar y crear.
Campo | Valor |
|---|---|
Red virtual | IMPORTANTE. Seleccione la red virtual donde está implementado el punto final de la API de Voyage. |
Subred | IMPORTANTE. Seleccione la subred dentro de la red virtual donde se implementa el punto final de la API de Voyage. |
IP pública | IMPORTANTE: Cree una nueva IP pública. Si no la crea, no podrá acceder a su máquina virtual desde fuera de la red virtual. |
Grupo de seguridad de red NIC | Seleccione "Básico". |
Puertos públicos de entrada | Seleccione "Permitir puertos seleccionados". |
Seleccionar puertos de entrada | Seleccione "SSH (22)". |
Eliminar IP pública y NIC cuando se elimina la VM | Deje la casilla sin marcar. |
Habilitar redes aceleradas | Deje la casilla sin marcar. |
Opciones de equilibrio de carga | Selecciona "Ninguno". |
Revisar y crear
Verificar creación.
Verifique la creación de su máquina virtual bastión. Durante su creación, verá el estado "Implementación en curso". Verá que el estado cambia a "Su implementación está completa" cuando se haya creado correctamente. Haga clic en "Ir al recurso" para obtener la dirección IP pública de su máquina virtual bastión.
Invocar el punto final de la API de Voyage
Verificar que la API sea accesible.
Verifica que la API de Voyage sea accesible con el siguiente endpoint:
curl -X GET http://10.0.0.4/info
{"model":"voyage-4","model_loaded":true,"tokenizer_initialized":true,"loading_status":"completed","gpu_info":{"count":1,"memory_allocated_mb":XXX,"memory_reserved_mb": XXX}}
Hacer una solicitud
Puede realizar una solicitud a la API de Voyage con el siguiente punto final: http://{voyage-app-vnet-private-ip}/embeddings.
curl -X GET "http://10.0.0.4/embeddings" \ -H "Content-Type: application/json" \ -d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}
Para todos los parámetros de punto final, consulte la referencia de API.
Eliminar una aplicación de API de viajes
Para eliminar el punto final de la API de Voyage, acceda a su aplicación y haga clic en el botón "Eliminar" en la sección "Información general". En el cuadro de diálogo que aparece, haga clic en "Sí" para confirmar la eliminación. Esto también eliminará el grupo de recursos administrados asociado.
Eliminar la máquina virtual Bastion
Si ha aprovisionado una máquina virtual bastión, elimínela para evitar incurrir en costos innecesarios y cargos inesperados.
Confirmar eliminación.
En el panel de eliminación, asegúrese de que se hayan eliminado todos los recursos de la máquina virtual marcando las casillas que se muestran en la siguiente captura de pantalla: Aplicar eliminación forzada, Disco del sistema operativo, Interfaces dered y Direcciones IP públicas. Marque la casilla de confirmación: "He leído y comprendido que esta máquina virtual, así como cualquier recurso asociado seleccionado anteriormente, se eliminarán". Finalmente, haga clic en "Eliminar".