Docs Menu
Docs Home
/

Implementar modelos de IA de Voyage mediante Azure Marketplace

Puede utilizar aplicaciones administradas de Azure Implementar modelos de IA de Voyage como puntos de conexión de API de inferencia en tiempo real en una cuenta de Azure y una red virtual (VNet) de un cliente. Las aplicaciones administradas por Azure ofrecen las siguientes ventajas clave:

  1. Flujo de datos y control de acceso: los datos nunca abandonan su red virtual, lo que aborda los riesgos de privacidad de datos asociados con el servicio de terceros o de múltiples inquilinos.

  2. Confiabilidad y cumplimiento respaldados por Azure: Azure actúa como su único subprocesador, por lo que hereda todas las garantías de confiabilidad y cumplimiento de Azure.

  3. Facturación y pago a través de Azure: al usar su información de facturación y créditos de Azure existentes para comprar modelos de Voyage AI, no necesita administrar un sistema de facturación y pago de terceros independiente.

Para ver qué modelos puedes implementar, busca "Voyage AI by MongoDB" en Azure Marketplace.

Para obtener más información sobre los modelos de Voyage AI, consulte Descripción general de los modelos.

Las aplicaciones administradas de Azure que utilizan modelos de Voyage AI se facturan por hora. El coste total por hora es la suma del precio de la máquina virtual (VM) (5 $ por hora) y el precio de la instancia subyacente en su región. Esta aplicación administrada de Azure no tiene coste de administración, por lo que el precio mensual indicado es de 0$.

Para implementar una aplicación administrada de Voyage Azure, debe tener lo siguiente:

  • Una suscripción de Azure existente.

  • Una red virtual existente para implementar una aplicación administrada por Azure Voyage. Para obtener instrucciones, consulte la sección "Crear una red virtual".

  • Cuota de vCPU de GPU suficiente para la familia de instancias que requiere la aplicación administrada de Azure Voyage elegida. Para saber cómo consultar su cuota o solicitar un aumento, consulte la sección Cuota.

Si cumple con todos los requisitos previos, pase a la sección Implementar un punto final de API de Voyage en una red virtual.

Esta sección incluye instrucciones sobre cómo consultar su cuota y solicitar un aumento si es necesario. Si tiene suficiente cuota, omita esta sección.

1
2

Seleccione la suscripción que desea usar para la aplicación administrada de Azure. En el siguiente ejemplo, seleccionamos la suscripción "Pago por uso". En la página de su suscripción, seleccione Uso + cuotas en Configuración.

3

Busque la familia de instancias de GPU que requiere la aplicación administrada de Azure Voyage en la barra de búsqueda. Por ejemplo, Standard_NC40ads_H100_v5 Standard_NC24ads_A100_v4o. Filtra la región según la que desees; en el ejemplo a continuación, filtramos la región por "Oeste de 2 EE. UU. ".

4

Asegúrese de tener suficiente cuota de vCPU de GPU para la cantidad de aplicaciones administradas por Voyage Azure que desea implementar. Si no tiene suficiente cuota, continúe con la siguiente sección (Solicitaraumento de cuota) para solicitar más cuota.

Desde la página Uso + cuotas de la suscripción deseada, puedes solicitar aumentar tu cuota:

1

Marque la casilla de la cuota de la familia de instancias de GPU que requiere la aplicación administrada de Voyage Azure que eligió. Seleccione el menú desplegable "Nueva solicitud de cuota" y seleccione "Ingresar un nuevo límite". Aparecerá el panel "Nueva solicitud de cuota".

2

En el panel "Nueva solicitud de cuota", introduzca la cuota deseada en el campo "Nuevo límite". Haga clic en "Enviar".

Si ya tiene una red virtual existente en la que desea implementar su aplicación administrada Voyage de Azure, omita esta sección.

1
2

Busca "red virtual".Selecciona "Red virtual" en los resultados.

3
4

Complete los campos en la pestaña Básico.

Campo
Valor

Suscripción

Seleccione su suscripción.

Grupo de recursos

Seleccione un grupo de recursos existente o cree uno nuevo.

Nombre de red virtual

Proporcione un nombre para su red virtual.

Región

Seleccione la región deseada. Esta región debe tener la cuota de recursos requerida.

5

Existen varias configuraciones avanzadas, como seguridad, direcciones IP y etiquetas. Si tiene requisitos de configuración avanzados, introdúzcalos en las pestañas correspondientes. Voyage no requiere ninguna configuración avanzada para implementar nuestra aplicación. Si no necesita ninguna configuración avanzada o no la conoce, haga clic en "Revisar y crear" para revisar y crear directamente su aplicación.

6

En la pestaña Revisar y crear, revise su configuración y haga clic en Crear para confirmar. De lo contrario, haga clic en el botón Anterior o en las pestañas correspondientes para realizar cambios.

7

Verifique la creación de su red virtual. Durante su creación, verá el estado "Implementación en curso".

Verá que el estado cambia a "Su implementación está completa" cuando su red virtual se haya creado correctamente.

En esta sección, implementará una aplicación administrada de Voyage Azure en su red virtual.

1

Selecciona la aplicación gestionada de Voyage Azure a la que te gustaría suscribir en el Azure Marketplace.

2
3
4

Cree una aplicación administrada de Azure con plan estándar seleccionando su suscripción y "Plan estándar" en los menús desplegables y haciendo clic en Crear.

5

Complete los campos de la pestaña "Configuración básica".Haga clic en "Siguiente" para ir a "Configuración de red".

Campo
Valor

Suscripción

Seleccione su suscripción.

Grupo de recursos

Seleccione el grupo de recursos que contiene la red virtual deseada.

Región

Seleccione la región deseada. Esta región debe tener la cuota de recursos requerida.

Nombre de la aplicación

Proporcione un nombre para su aplicación.

Managed Resource Group

Proporcione un nombre para su grupo de recursos administrados.

6

Complete los campos de la pestaña Configuración de red. Una vez completados, haga clic en Siguiente.

Campo
Valor

Seleccione una red virtual existente (no cree una nueva vnet)

Seleccione la red virtual existente que desee. El punto final de la API de Voyage se implementará en esta red virtual.

Seleccione o cree una subred que permita el tráfico HTTP

Selecciona la subred deseada. Selecciona "por defecto" si no tienes subredes personalizadas o avanzadas dentro de tu red virtual. El endpoint de la API Voyage desplegado tendrá una IP privada dentro de esta subred.

7

En la pestaña Revisar y crear, revise su configuración y haga clic en Crear para confirmar. De lo contrario, haga clic en el botón Anterior o en las pestañas correspondientes para realizar cambios.

8

Verifique la creación del punto final de su API de Voyage. Durante su creación, verá el estado "Implementación en curso".

9

Verá que el estado cambia a "Su implementación está completa" cuando su punto final de Voyage API se haya creado correctamente.

Importante

Haz clic en Ir a recurso para ver las propiedades de la aplicación.

10

Desde la página de recursos de la aplicación, obtenga la IP privada del endpoint haciendo clic en "Parámetros y salidas" en la sección "Configuración". Anote la IP privada (salida "privateIPAddress"); la necesitará para invocar los endpoints de la aplicación.

Si necesita ayuda para implementar un punto final de API de Voyage desde Azure Marketplace, comuníquese con el soporte técnico de MongoDB.

Una vez implementados, se puede acceder a los puntos finales de la API de Voyage a través de solicitudes HTTP por cualquier servicio dentro de la misma red virtual.

Para demostrar cómo acceder a los puntos de conexión de la API de Voyage, crearemos una máquina virtual bastión dentro de la misma red virtual. Si desea usar o tener otras máquinas/servidores en la red para consultar los puntos de conexión del modelo, puede omitir esta sección y pasar directamente a la sección "Invocar punto de conexión de la API de Voyage".

1

Desde la página de inicio del portal de Azure, haga clic en Crear un recurso.

2

Busca "máquina virtual". Selecciona "Máquina virtual" en los resultados.

3

Este procedimiento le guiará a través de la configuración de una máquina virtual de bajo costo, solo para fines de demostración. Si es un usuario avanzado, puede crear configuraciones personalizadas.

Complete los campos de la pestaña "Configuración básica". Una vez completados, haga clic en "Siguiente".

Campo
Valor

Suscripción

Seleccione su suscripción.

Grupo de recursos

Seleccione el grupo de recursos que contiene su punto final de API de Voyage.

Nombre de la máquina virtual

Proporcione un nombre para su máquina virtual.

Región

Seleccione la región del punto final de su API de Voyage.

Opciones de disponibilidad

Seleccione "No se requiere redundancia de infraestructura"

Tipo de seguridad

Seleccione "Estándar".

Imagen

Seleccione "Ubuntu Server 24.04 LTS - x64 Gen2".

Arquitectura de máquina virtual

Seleccione "x64".

Ejecute con descuento de Azure Spot

Deje la casilla sin marcar.

Tamaño

Seleccione "Standard_B1s - 1 vcpu, 1GiB de memoria".

Habilitar hibernación

Deje la casilla sin marcar.

Tipo de autenticación

Seleccione "Clave pública SSH".

Nombre de usuario

Introduzca "viaje".

Fuente de clave pública SSH

Seleccione "Generar nuevo par de claves".

Tipo de clave SSH

Seleccione "Formato RSA SSH".

Nombre del par de claves

Introduzca "vm-voyage_key".

Puertos públicos de entrada

Seleccione "Permitir puertos seleccionados".

Seleccionar puertos de entrada

Seleccione "SSH (22)".

Complete los campos de la pestaña Discos. Una vez completados,haga clic en Siguiente para pasar a Redes.

Campo
Valor

Cifrado en el host

Deje la casilla sin marcar.

OS disk size

Seleccione "Imagen predeterminada (30 GiB)".

OS disk type

Seleccione "HDD estándar (almacenamiento con redundancia local)".

Eliminar con VM

Marcar la casilla.

Gestión de claves

Seleccione "Clave administrada por la plataforma".

Habilitar la compatibilidad con Ultra Disk

Deje la casilla sin marcar.

Complete los campos de la pestaña Redes. Una vez completados, haga clic en Revisar y crear.

Campo
Valor

Red virtual

IMPORTANTE. Seleccione la red virtual donde está implementado el punto final de la API de Voyage.

Subred

IMPORTANTE. Seleccione la subred dentro de la red virtual donde se implementa el punto final de la API de Voyage.

IP pública

IMPORTANTE: Cree una nueva IP pública. Si no la crea, no podrá acceder a su máquina virtual desde fuera de la red virtual.

Grupo de seguridad de red NIC

Seleccione "Básico".

Puertos públicos de entrada

Seleccione "Permitir puertos seleccionados".

Seleccionar puertos de entrada

Seleccione "SSH (22)".

Eliminar IP pública y NIC cuando se elimina la VM

Deje la casilla sin marcar.

Habilitar redes aceleradas

Deje la casilla sin marcar.

Opciones de equilibrio de carga

Selecciona "Ninguno".

1

En la pestaña Revisar y crear, revise su configuración y haga clic en Crear para confirmar. De lo contrario, haga clic en el botón Anterior o en las pestañas correspondientes para realizar cambios.

2

Aparecerá la ventana "Generar nuevo par de claves". Haga clic en "Descargar clave privada y crear recurso" para guardar la clave en su equipo local. Anote dónde la guardó.

3

Verifique la creación de su máquina virtual bastión. Durante su creación, verá el estado "Implementación en curso". Verá que el estado cambia a "Su implementación está completa" cuando se haya creado correctamente. Haga clic en "Ir al recurso" para obtener la dirección IP pública de su máquina virtual bastión.

4

En la página de su máquina virtual bastión, puede encontrar la dirección IP pública en la sección Descripción general, en Aspectos esenciales.

5

Actualice los permisos de la clave privada SSH que descargó a solo lectura:

chmod 400 vm-voyage_key.pem
6

Inicie sesión de forma segura en el shell de la máquina virtual bastión (SSH) con su clave privada. El formato es: ssh -i {private-ssh-key} voyage@{bastion-vm-public-ip-address}. Por ejemplo: ssh -i vm-voyage_key.pem voyage@52.143.109.43.

1

Verifica que la API de Voyage sea accesible con el siguiente endpoint:

curl -X GET http://10.0.0.4/info
{"model":"voyage-4","model_loaded":true,"tokenizer_initialized":true,"loading_status":"completed","gpu_info":{"count":1,"memory_allocated_mb":XXX,"memory_reserved_mb": XXX}}
2

Puede realizar una solicitud a la API de Voyage con el siguiente punto final: http://{voyage-app-vnet-private-ip}/embeddings.

curl -X GET "http://10.0.0.4/embeddings" \
-H "Content-Type: application/json" \
-d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}

Para todos los parámetros de punto final, consulte la referencia de API.

Para eliminar el punto final de la API de Voyage, acceda a su aplicación y haga clic en el botón "Eliminar" en la sección "Información general". En el cuadro de diálogo que aparece, haga clic en "Sí" para confirmar la eliminación. Esto también eliminará el grupo de recursos administrados asociado.

Si ha aprovisionado una máquina virtual bastión, elimínela para evitar incurrir en costos innecesarios y cargos inesperados.

1

Vaya a su máquina virtual bastión y haga clic en el botón Eliminar en la sección Descripción general. Aparecerá un panel de eliminación.

2

En el panel de eliminación, asegúrese de que se hayan eliminado todos los recursos de la máquina virtual marcando las casillas que se muestran en la siguiente captura de pantalla: Aplicar eliminación forzada, Disco del sistema operativo, Interfaces dered y Direcciones IP públicas. Marque la casilla de confirmación: "He leído y comprendido que esta máquina virtual, así como cualquier recurso asociado seleccionado anteriormente, se eliminarán". Finalmente, haga clic en "Eliminar".

Volver

AWS Marketplace

En esta página