Docs 菜单
Docs 主页
/

使用Azure Marketplace 部署 Voyage AI模型

您可以使用Azure托管应用程序 将 Voyage AI模型部署为客户Azure帐户和虚拟网络 (VNet) 中的实时推理API端点。 Azure托管应用程序具有以下主要优势:

  1. 数据流和访问权限控制:数据永远不会离开虚拟网络,从而解决与第三方或多租户服务相关的数据隐私风险。

  2. 由Azure支持的可靠性和合合规: Azure作为您唯一的分处理者,因此您可以继承 Azure 的所有可靠性和合合规ACID 一致性保证。

  3. 通过Azure进行计费和支付:使用现有的Azure账单信息和积分来购买 Voyage AI模型,无需管理单独的第三方支付和计费系统。

要查看可以部署哪些模型,请在Azure市场中搜索“Voyage AI by MongoDB ”。

要学习;了解有关 Voyage AI模型的详情,请参阅 模型概述。

使用 Voyage AI模型的Azure托管应用程序按小时计费。每小时总费用是虚拟机 (VM) 价格(5 美元/小时)和您所在地区的根本的实例价格的总和。此托管Azure应用程序没有管理费用,因此列出的Azure托管应用程序每月价格为 0 美元。

要部署Voyage Azure托管应用程序,您必须具备以下条件:

  • 现有的Azure订阅。

  • 用于部署Voyage Azure托管应用程序的现有虚拟网络。有关说明,请参阅“创建虚拟网络”部分。

  • 为所选 Voyage Azure托管应用程序所需的实例系列提供足够的 GPU vCPU 配额。如需学习;了解如何检查配额或请求增加配额,请参阅“配额”部分。

如果您满足所有先决条件,请跳至“在虚拟网络中部署 Voyage API端点”部分。

本节包括如何检查配额并在必要时请求增加配额的指导。如果您有足够的配额,请跳过本节。

1
2

选择要用于Azure托管应用程序的订阅。在以下示例中,我们选择“按需付费”订阅。在订阅页面中,选择“设置”下的“使用情况 + 配额”。

3

在搜索栏中搜索所选 Voyage Azure托管应用程序所需的 GPU实例系列。示例,Standard_NC40ads_H100_v5Standard_NC24ads_A100_v4 。筛选所需地区的地区;在以下示例中,我们筛选了“美国西部”的地区。2

4

确保您有足够的 GPU vCPU 配额用于要部署的Voyage Azure托管应用程序的数量。如果没有足够的配额,请继续执行下一部分(请求增加配额)以请求更多配额。

在所需订阅的“使用量 + 配额”页面中,您可以请求增加配额:

1

选中所选 Voyage Azure托管应用程序所需的 GPU实例配额的复选框。选择“新配额请求”下拉列表,然后选择“输入新限制”。将显示“新配额请求”面板。

2

在“新配额请求”面板的“新限制”字段中输入所需的配额。单击“提交”。

如果您已有虚拟网络想要在其中部署Voyage Azure托管应用程序,请跳过本节。

1
2

搜索“虚拟网络”。从结果中选择虚拟网络。

3
4

填写 Basics(基础)标签页中的字段。

字段

订阅

选择您的订阅。

资源群组

选择现有资源群组或创建新资源群组。

虚拟网络名称

为您的虚拟网络提供一个名称。

区域

选择所需地区。此地区必须具有所需的资源配额。

5

有几种高级配置,如安全性、 IP地址和标签。如果您有高级配置要求,请在相应的标签页中输入。 Voyage 不需要任何高级配置来部署我们的应用程序。如果您不需要任何高级配置或不知道,请单击“查看 + 创建”,直接查看并创建您的应用程序。

6

在“查看 + 创建”标签页中,查看您的配置,然后单击“创建”进行确认。否则,请单击“上一个”按钮或相应的标签页进行更改。

7

验证虚拟网络创建。在创建过程中,您将看到状态为“部署正在进行中”。

成功创建虚拟网络后,您将看到状态更改为“部署已完成”。

在本部分中,您将在虚拟网络中部署Voyage Azure托管应用程序。

1

在Azure Marketplace 中选择您想要订阅的 Voyage Azure托管应用程序。

2
3
4

从下拉菜单中选择订阅和“标准计划”,然后单击“创建”,创建标准计划Azure托管应用程序。

5

填写 Basics(基础)标签页中的字段。单击“下一步”进入“网络设置”。

字段

订阅

选择您的订阅。

资源群组

选择包含所需虚拟网络的资源群组。

区域

选择所需地区。此地区必须具有所需的资源配额。

ApplicationName

为您的应用程序提供一个名称。

托管资源组

为托管资源群组提供名称。

6

填写“网络设置”标签标签页中的字段。完成后,单击“下一步”。

字段

选择现有虚拟网络(不要创建新的虚拟网络)

选择所需的现有虚拟网络。 Voyage API端点将部署到该虚拟网络中。

选择或创建允许HTTP流量的子网

选择所需的子网。如果您的虚拟网络中没有自定义子网或高级子网,请选择“默认”。部署的 Voyage API端点将在此子网内拥有一个私有IP解决。

7

在“查看 + 创建”标签页中,查看您的配置,然后单击“创建”进行确认。否则,请单击“上一个”按钮或相应的标签页进行更改。

8

验证您的 Voyage API端点创建。在创建过程中,您将看到状态为“部署正在进行中”。

9

成功创建 Voyage API端点后,您将看到状态更改为“部署已完成”。

重要

单击“Go资源”以查看应用程序属性。

10

在应用程序资源页面中,单击“设置”部分下的“参数和输出”,获取端点的私有IP 。记下私有IP ("privateIPAddress" 输出);您将需要此IP解决来调用应用程序端点。

如果您在从Azure市场部署 Voyage API端点时需要帮助,联系MongoDB支持。

部署后,同一虚拟网络中的任何服务都可以通过HTTP请求访问 Voyage API端点。

为了演示如何访问权限Voyage API端点,我们将在同一虚拟网络中创建一个堡垒虚拟机。如果您想使用或让网络中的其他现有计算机/服务器来查询模型端点,您可以跳过本节并跳转到 Invoke Voyage API Endpoint(调用 Voyage API 端点)部分。

1

在Azure门户主页中,单击“创建资源”。

2

搜索“虚拟机”。从结果中选择虚拟机。

3

此过程将引导您完成低成本虚拟机配置,但仅用于演示目的。如果您是高级用户,则可以进行自定义配置。

填写“Basics”(基础)标签页中的字段。完成后,单击“下一步”。

字段

订阅

选择您的订阅。

资源群组

选择包含您的 Voyage API端点的资源群组。

虚拟机名称

为您的虚拟机命名。

区域

选择您的 Voyage API端点所在的地区。

可用性选项

选择“无需基础架构冗余”

安全类型

选择“标准”。

Image

选择“Ubuntu Server 24.04 LTS - x64 Gen2”。

虚拟机架构

选择“x64”。

使用Azure Spot 折扣运行

保持复选框未选中。

size

选择“Standard_B1s - 1 vcpu, 1GiB 内存”。

启用休眠

保持复选框未选中。

身份验证类型

选择“SSH 公钥”。

用户名

输入“航程”。

SSH 公钥源

选择“生成新的密钥对”。

SSH 密钥类型

选择“RSA SSH 格式”。

密钥对名称

输入“vm-voyage_key”。

公共入站端口

选择“允许选定的端口”。

选择入站端口

选择“SSH (22)”。

填写“Disks”(磁盘)标签页中的字段。完成后,单击“下一步”以转到“网络”。

字段

托管加密

保持复选框未选中。

OS disk size

选择“默认映像 (30 GiB)”。

OS disk type

选择“标准 HDD(本地冗余存储)”。

使用虚拟机删除

选中复选框。

密钥管理

选择“平台托管密钥”。

启用超级磁盘兼容性

保持复选框未选中。

填写“网络”标签页中的字段。完成后,单击“查看 + 创建”。

字段

虚拟网络

重要提示。选择部署 Voyage API端点的虚拟网络。

子网

重要提示。选择虚拟网络中部署您的 Voyage API端点的子网。

公共 IP

重要提示。创建新的公共IP。如果不创建此项,您将无法从虚拟网络外部访问权限虚拟机。

NIC 网络安全群组

选择“基本”。

公共入站端口

选择“允许选定的端口”。

选择入站端口

选择“SSH (22)”。

删除虚拟机时删除公共IP和 NIC

保持复选框未选中。

启用加速联网

保持复选框未选中。

负载均衡选项

选择“无”。

1

在“查看 + 创建”标签页中,查看您的配置,然后单击“创建”进行确认。否则,请单击“上一个”按钮或相应的标签页进行更改。

2

此时将显示一个新的“生成新密钥对”模式。单击下载私钥并创建资源,将密钥保存到本地计算机。请注意保存密钥的位置。

3

验证堡垒虚拟机的创建。在创建过程中,您将看到状态为“部署正在进行中”。成功创建堡垒虚拟机后,您将看到状态更改为“部署已完成”。单击“Go资源”以获取您的堡垒虚拟机公共IP解决。

4

在堡垒虚拟机页面中,您可以在“Essentials”下的“概述”部分找到公共IP解决。

5

将下载的 SSH 私钥的权限更新为只读:

chmod 400 vm-voyage_key.pem
6

使用私钥安全登录堡垒虚拟机Shell (SSH)。格式为:ssh -i {private-ssh-key} voyage@{bastion-vm-public-ip-address}。示例:ssh -i vm-voyage_key.pem voyage@52.143.109.43

1

验证可通过以下端点访问 Voyage API :

curl -X GET http://10.0.0.4/info
{"model":"voyage-4","model_loaded":true,"tokenizer_initialized":true,"loading_status":"completed","gpu_info":{"count":1,"memory_allocated_mb":XXX,"memory_reserved_mb": XXX}}
2

您可以使用以下端点向 Voyage API发出请求:http://{voyage-app-vnet-private-ip}/embeddings

curl -X GET "http://10.0.0.4/embeddings" \
-H "Content-Type: application/json" \
-d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}

有关所有端点参数,请参阅API参考。

要删除您的 Voyage API端点,请转到您的应用程序,然后单击概述部分中的删除按钮。在出现的对话框中,单击“是”确认删除。此操作还会删除关联的托管资源群组。

如果您已预配堡垒虚拟机,删除该虚拟机,以免产生不必要的成本和意外费用。

1

Go您的堡垒虚拟机,然后单击“概述”部分中的“删除”按钮。出现删除面板。

2

在删除面板中,选中以下屏幕截图中显示的所有复选框,确保删除所有虚拟机资源:应用强制删除、操作系统磁盘、网络接口、公共IP地址。选中确认复选框:“我已阅读并了解此虚拟机以及上面列出的任何选定的关联资源将被删除。”最后,单击“删除”。

后退

AWS Marketplace

在此页面上