Join us at MongoDB.local London on 7 May to unlock new possibilities for your data. Use WEB50 to save 50%.
Register now >
Menu Docs
Página inicial do Docs
/

Implante modelos de IA do Voyage usando o Azure Marketplace

Você pode usar aplicativos gerenciados pelo Azure para implantar modelos de IA do Voyage como pontos de extremidade da API de inferência em tempo real em uma conta do Azure e uma rede virtual (VNet) do cliente. Os aplicativos gerenciados pelo Azure oferecem os seguintes benefícios principais:

  1. Fluxo de dados e controle de acesso: os dados nunca saem da sua rede virtual, abordando os riscos de privacidade de dados associados ao serviço de terceiros ou de vários inquilinos.

  2. Reliability and compliance backed by Azure: Azure serve como seu único subprocessador, então você herda todas as garantias de confiabilidade e compliance do Azure.

  3. Faturamento e pagamento por meio do Azure: ao usar suas informações de cobrança e créditos existentes do Azure para comprar modelos de IA do Voyage, você não precisa gerenciar um sistema separado de pagamento e cobrança de terceiros.

Para ver quais modelos você pode implantar, procure por "Voyage IA by MongoDB" no Azure Marketplace.

Para aprender mais sobre os modelos de IA do Voyage, consulte Visão geral dos modelos.

Os aplicativos gerenciados pelo Azure usando modelos de IA Voyage são cobrados por hora. O custo total por hora é a soma do preço da máquina virtual (VM) (US$5 por hora) e o preço da instância subjacente em sua região. Não há custo de gerenciamento para esse aplicativo gerenciado do Azure, e é por isso que o preço mensal listado do aplicativo gerenciado do Azure é de US$0.

Para implementar um aplicativo gerenciado do Voyage Azure, você deve ter o seguinte:

  • Uma assinatura existente do Azure.

  • Uma rede virtual existente para implantar um aplicativo gerenciado do Voyage Azure. Para obter instruções, consulte a seção Criar uma rede virtual.

  • Cota de vCPU de GPU suficiente para a família de instâncias exigida pelo aplicativo gerenciado do Voyage Azure escolhido. Para aprender como verificar sua cota ou solicitar uma solicitação de aumento de cota, consulte a seção Cota.

Se você atender a todos os pré-requisitos, pule para a seção Implantar um ponto de extremidade da API do Voyage em Rede Virtual.

Esta seção inclui orientações sobre como verificar sua cota e solicitar um aumento, se necessário. Se você tiver cota suficiente, pule esta seção.

1
2

Selecione a assinatura que deseja usar para o aplicativo gerenciado pelo Azure. No exemplo a seguir, selecionamos a assinatura "pagamento conforme o uso". Na sua página de assinatura, selecione Uso + cotas em Configurações.

3

Procure a família de instâncias de CPU exigida pelo aplicativo gerenciado do Voyage Azure escolhido na barra de pesquisa. Por exemplo, Standard_NC40ads_H100_v5 ou Standard_NC24ads_A100_v4. Filtre a Região para a região desejada; no exemplo abaixo, filtramos a região para "West US 2."

4

Verifique se você tem cota de vCPU para o número de aplicativos gerenciados pelo Voyage Azure que deseja implantar. Se você não tiver cota suficiente, continue para a próxima seção (Solicitação de aumento de cota) para solicitar mais cota.

Na página Uso + cotas da assinatura desejada, você pode solicitar o aumento da cota:

1

Marque a caixa de seleção da cota da família de instâncias de CPU exigida pelo aplicativo gerenciado do Voyage Azure escolhido. Selecione o menu suspenso Nova Solicitação de Cota e selecione Inserir um novo limite. Um painel Nova Solicitação de Cota será exibido.

2

No painel Nova Solicitação de Cota, insira a cota desejada no campo Novo limite. Click enviar.

Se você já tiver uma rede virtual existente na qual deseja implantar seu aplicativo gerenciado do Voyage Azure, ignore esta seção.

1
2

Pesquise por "rede virtual". Selecione Rede virtual nos resultados.

3
4

Preencha os campos na aba Noções básicas.

Campo
Valor

inscrição

Selecione sua assinatura.

Grupo de recursos

Selecione um grupo de recursos existente ou crie um novo grupo de recursos.

Nome da rede virtual

Forneça um nome para sua rede virtual.

Região

Selecione a região desejada. Esta região deve ter a cota de recursos necessária.

5

Existem várias configurações avançadas, como segurança, endereços IP e tags. Se você tiver requisitos de configuração avançados, insira-os nas abas apropriadas. A Voyage não requer nenhuma configuração avançada para implantar nosso aplicativo. Se você não precisar de nenhuma configuração avançada ou não souber, clique em Revisar + criar para revisar e criar diretamente seu aplicativo.

6

Na aba Revisar + criar, revise sua configuração e clique em Criar para confirmar. Caso contrário, clique no botão anterior ou nas abas correspondentes para fazer alterações.

7

Verifique a criação da rede virtual. À medida que ele é criado, você verá o status "A implantação está em andamento".

Você verá a mudança de status para "Sua implantação está concluída" quando sua rede virtual tiver sido criada com êxito.

Nesta seção, você implanta um aplicativo gerenciado do Voyage Azure em sua rede virtual.

1

Selecione o aplicativo gerenciado do Voyage Azure que você gostaria de assinar no Azure Marketplace.

2
3
4

Crie um aplicativo gerenciado do Azure de plano padrão selecionando sua assinatura e "Plano padrão" nos menus suspensos e clicando em Criar.

5

Preencha os campos na aba Noções básicas. Clique em Avançar para mover para Configurações de rede.

Campo
Valor

inscrição

Selecione sua assinatura.

Grupo de recursos

Selecione o grupo de recursos que contém a rede virtual desejada.

Região

Selecione a região desejada. Esta região deve ter a cota de recursos necessária.

Nome do aplicativo

Forneça um nome para seu aplicativo.

Grupo de recursos gerenciados

Forneça um nome para seu grupo de recursos gerenciados.

6

Preencha os campos na aba Configurações de rede. Depois de concluir, clique em Avançar.

Campo
Valor

Selecione uma rede virtual existente (não crie uma nova vnet)

Selecione a rede virtual existente desejada. O ponto de extremidade da API do Voyage será implantado nessa rede virtual.

Selecione ou crie uma sub-rede que permita o tráfego HTTP

Selecione a sub-rede desejada. Selecione "padrão" se você não tiver sub-redes personalizadas ou avançadas dentro de sua rede virtual. O ponto de extremidade da API Voyage implantado terá um endereço IP privado dentro desta sub-rede.

7

Na aba Revisar + criar, revise sua configuração e clique em Criar para confirmar. Caso contrário, clique no botão anterior ou nas abas correspondentes para fazer alterações.

8

Verifique a criação do ponto de extremidade da API Voyage. À medida que ele é criado, você verá o status "A implantação está em andamento".

9

Você verá a mudança de status para "Sua implantação está concluída" quando o ponto de extremidade da API Voyage tiver sido criado com êxito.

Importante

Clique em Ir para recurso para exibir as propriedades do aplicativo.

10

Na página de recursos do aplicativo, obtenha o IP privado do ponto de extremidade clicando em Parâmetros e saídas na seção Configurações. Anote o IP privado (saída "privateIPAddress"); você precisará desse endereço IP para invocar os pontos de extremidade do aplicativo.

Se precisar de ajuda para implantar um ponto de extremidade da API do Voyage a partir do Azure Marketplace, entre em contato com o suporte do MongoDB.

Depois de implantados, os pontos de extremidade da API do Voyage podem ser acessados por meio de solicitações HTTP por qualquer serviço dentro da mesma rede virtual.

Para demonstrar como acessar os pontos de extremidade da API Voyage, criaremos uma máquina virtual de bastion dentro da mesma rede virtual. Se quiser usar ou tiver outros máquinas/servidores existentes na rede para query os pontos de extremidade do modelo, você pode pular esta seção e pular para a seção Invoke Voyage API Endpoint.

1

Na página inicial do portal do Azure, clique em Criar um recurso.

2

Pesquise por "máquina virtual". Selecione Máquina virtual nos resultados.

3

Este procedimento orienta você por uma configuração de máquina virtual de baixo custo apenas para fins de demonstração. Se você é um usuário avançado, pode fazer configurações personalizadas.

Preencha os campos na aba Noções básicas. Depois de concluído, clique em Avançar.

Campo
Valor

inscrição

Selecione sua assinatura.

Grupo de recursos

Selecione o grupo de recursos que contém o ponto de extremidade da API Voyage.

Nome da máquina virtual

Forneça um nome para sua máquina virtual.

Região

Selecione a região do ponto de extremidade da API do Voyage.

Opções de disponibilidade

Selecione "Nenhuma redundância de infraestrutura necessária"

Tipo de segurança

Selecione "Padrão".

Imagem

Selecione "Servidor Ubuntu 24.04 LTS - x64 Ger2".

Arquitetura de VM

Selecione "x64".

Execute com desconto do Azure Ponto

Deixe a caixa desmarcada.

Tamanho

Selecione "Standard_B1s - 1 vspu, 1GiB memory".

Habilitar hibernação

Deixe a caixa desmarcada.

Tipo de autenticação

Selecione "Chave pública SSH".

Nome de usuário

Insira "voyage".

Fonte da chave pública SSH

Selecione "Gerar novo par de chaves".

Tipo de chave SSH

Selecione "Formato SSH RSA".

Nome do par de chaves

Insira "vm-voyage_key".

Portas de entrada públicas

Selecione "Permitir portas selecionadas".

Selecionar portas de entrada

Selecione "SSH (22)".

Preencha os campos na aba Discos. Depois de concluir, clique em Avançar para mudar para Rede.

Campo
Valor

Criptografia no host

Deixe a caixa desmarcada.

OS disk size

Selecione "Padrão de imagem (30 GiB)".

OS disk type

Selecione "HDD padrão (armazenamento localmente redundante)".

Excluir com VM

Marque a caixa.

Gerenciamento de chaves

Selecione "Chave gerenciada pela plataforma".

Habilitar compatibilidade com ultradisco

Deixe a caixa desmarcada.

Preencha os campos na aba Rede. Depois de concluído, clique em Revisar + criar.

Campo
Valor

Rede virtual

IMPORTANTE. Selecione a rede virtual na qual o ponto de extremidade da API Voyage está implantado.

Sub-rede

IMPORTANTE. Selecione a sub-rede dentro da rede virtual na qual seu ponto de extremidade da API Voyage está implantado.

IP público

IMPORTANTE. Crie um novo IP público. Se você não criar isso, não poderá acessar sua máquina virtual de fora da rede virtual.

Grupo de segurança de rede NIC

Selecione "Básico".

Portas de entrada públicas

Selecione "Permitir portas selecionadas".

Selecionar portas de entrada

Selecione "SSH (22)".

Excluir IP público e NIC quando a VM for excluída

Deixe a caixa desmarcada.

Habilitar rede acelerada

Deixe a caixa desmarcada.

Opções de balanceamento de carga

Selecione "Nenhum".

1

Na aba Revisar + criar, revise sua configuração e clique em Criar para confirmar. Caso contrário, clique no botão anterior ou nas abas correspondentes para fazer alterações.

2

Um novo modal Gerar novo par de chaves é exibido. Clique em Baixar chave privada e criar recurso para salvar a chave em sua máquina local. Observe onde você salvou a chave.

3

Verifique a criação da máquina virtual bastion. À medida que ele é criado, você verá o status "A implantação está em andamento". Você verá a mudança de status para "Sua implantação está concluída" quando sua máquina virtual bastion tiver sido criada com êxito. Clique em Go para recurso para obter o endereço IP público da máquina virtual bastion.

4

Na página da máquina virtual bastion, você pode encontrar o endereço IP público na seção Visão geral, em Essenciais.

5

Atualize as permissões da chave privada SSH que você baixou para somente leitura:

chmod 400 vm-voyage_key.pem
6

Faça login com segurança no shell da máquina virtual (SSH) bastion usando sua chave privada. O formato é: ssh -i {private-ssh-key} voyage@{bastion-vm-public-ip-address}. Por exemplo: ssh -i vm-voyage_key.pem voyage@52.143.109.43.

1

Verifique se a API Voyage está acessível com o seguinte ponto de extremidade:

curl -X GET http://10.0.0.4/info
{"model":"voyage-4","model_loaded":true,"tokenizer_initialized":true,"loading_status":"completed","gpu_info":{"count":1,"memory_allocated_mb":XXX,"memory_reserved_mb": XXX}}
2

Você pode fazer uma solicitação à API Voyage com o seguinte ponto de extremidade: http://{voyage-app-vnet-private-ip}/embeddings.

curl -X GET "http://10.0.0.4/embeddings" \
-H "Content-Type: application/json" \
-d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}

Para todos os parâmetros do ponto de extremidade, consulte a referência da API.

Para excluir seu ponto de extremidade da API Voyage, acesse seu aplicativo e clique no botão Excluir na seção Visão geral. Na caixa de diálogo exibida, clique em Sim para confirmar a exclusão. Isso também exclui o grupo de recursos gerenciados associado.

Se você tiver provisionado uma máquina virtual bastion, exclua a máquina virtual para evitar custos incorridos e cobranças inesperadas.

1

Vá até sua máquina virtual bastion e clique no botão Excluir na seção Visão geral. Um painel de exclusão será exibido.

2

No painel de exclusão, certifique-se de que todos os recursos da máquina virtual sejam excluídos marcando todas as caixas de seleção mostradas na captura de tela abaixo: Aplicar exclusão forçada, Disco do sistema operacional, Interfaces de rede, Endereços IP públicos. Marque a caixa de seleção de confirmação: "Li e entenda que esta máquina virtual, bem como quaisquer recursos associados selecionados listados acima, serão excluídos." Por fim, clique em Excluir.

Voltar

AWS Marketplace

Nesta página