您可以使用Azure托管应用程序 将 Voyage AI模型部署为客户Azure帐户和虚拟网络 (VNet) 中的实时推理API端点。Azure托管应用程序具有以下主要优势:
数据流和访问权限控制:数据永远不会离开虚拟网络,从而解决与第三方或多租户服务相关的数据隐私风险。
由Azure支持的可靠性和合规: Azure作为您唯一的分处理者,因此您可以继承 Azure 的所有可靠性和ACID 一致性保证。
通过Azure进行计费和支付:使用现有的Azure账单信息和信用购买 Voyage AI模型,无需管理单独的第三方支付和计费系统。
可用型号
要查看可以部署哪些模型,请在Azure市场中搜索“Voyage AI by MongoDB ”。
要学习;了解有关 Voyage AI模型的详情,请参阅 模型概述。
定价
使用 Voyage AI模型的Azure托管应用程序按小时计费。每小时总费用是虚拟机 (VM) 价格(5 美元/小时)和您所在地区的根本的实例价格的总和。此托管Azure应用程序没有管理费用,因此列出的Azure托管应用程序每月价格为 0 美元。
先决条件
要部署Voyage Azure托管应用程序,您必须具备以下条件:
现有的Azure订阅。
用于部署Voyage Azure托管应用程序的现有虚拟网络。有关说明,请参阅“创建虚拟网络”部分。
为所选 Voyage Azure托管应用程序所需的实例系列提供足够的 GPU vCPU 配额。如需学习;了解如何检查配额或请求增加配额,请参阅“配额”部分。
如果您满足所有先决条件,请跳至在虚拟网络中部署 Voyage API 终结点部分。
Quota
本节包括如何检查配额并在必要时请求增加配额的指导。如果您有足够的配额,请跳过本节。
Check Quota
Go到 Azure门户 中的 订阅 。
Verify quota.
确保您有足够的 GPU vCPU 配额用于要部署的Voyage Azure托管应用程序的数量。如果没有足够的配额,请继续执行下一部分(请求增加配额)以请求更多配额。
请求增加配额
在所需订阅的“使用量 + 配额”页面中,您可以请求增加配额:
创建虚拟网络
如果您已经拥有想要在其中部署Voyage Azure托管应用程序的现有虚拟网络,请跳过本节。
在虚拟网络中部署 Voyage API 终结点
在本部分中,您将在虚拟网络中部署Voyage Azure托管应用程序。
如果您在从Azure市场部署 Voyage API终结点时需要帮助,联系MongoDB支持。
访问 Voyage API 终结点
部署后,同一虚拟网络中的任何服务都可以通过HTTP请求访问 Voyage API 终结点。
创建 Bastion 虚拟机
为了演示如何访问Voyage API端点,我们将在同一虚拟网络中创建一个堡垒虚拟机。如果您想使用或让网络中的其他现有计算机/服务器来查询模型终结点,您可以跳过本节并跳转到 Invoke Voyage API 终结点 部分。
此过程将引导您完成低成本虚拟机配置,但仅用于演示目的。如果您是高级用户,则可以进行自定义配置。
基础信息
填写“Basics”(基础)标签页中的字段。完成后,单击“下一个”。
字段 | 值 |
|---|---|
订阅 | 选择您的订阅。 |
资源群组 | 选择包含您的 Voyage API终结点的资源群组。 |
虚拟机名称 | 为您的虚拟机命名。 |
区域 | 选择您的 Voyage API 终结点所在的区域。 |
可用性选项 | 选择“无需基础架构冗余” |
安全类型 | 选择“标准”。 |
Image | 选择“Ubuntu 服务器 24.04LTS - x64 Gen2”。 |
虚拟机架构 | 选择“x64”。 |
使用Azure Spot 折扣运行 | 保持复选框未选中。 |
size | 选择“Standard_B1s - 1 vcpu, 1GiB 内存”。 |
启用休眠 | 保持复选框未选中。 |
身份验证类型 | 选择“SSH 公钥”。 |
用户名 | 输入“航程”。 |
SSH 公钥源 | 选择“生成新的密钥对”。 |
SSH 密钥类型 | 选择“RSA SSH 格式”。 |
密钥对名称 | 输入“vm-voyage_key”。 |
公共入站端口 | 选择“允许选定的端口”。 |
选择入站端口 | 选择“SSH (22)”。 |
磁盘
填写“Disks”(磁盘)标签页中的字段。完成后,单击下一个以转到网络。
字段 | 值 |
|---|---|
托管加密 | 保持复选框未选中。 |
OS disk size | 选择“默认映像 (30 GiB)”。 |
OS disk type | 选择“标准 HDD(本地冗余存储)”。 |
使用虚拟机删除 | 选中复选框。 |
密钥管理 | 选择“平台托管密钥”。 |
启用超级磁盘兼容性 | 保持复选框未选中。 |
网络
填写“网络”标签页中的字段。完成后,单击查看 + 创建。
字段 | 值 |
|---|---|
虚拟网络 | 重要提示。选择部署 Voyage API 终结点的虚拟网络。 |
子网 | 重要.选择虚拟网络中部署您的 Voyage API端点的子网。 |
公共 IP | 重要.创建新的公共IP。如果不创建此项,您将无法从虚拟网络外部访问权限虚拟机。 |
NIC 网络安全群组 | 选择“基本”。 |
公共入站端口 | 选择“允许选定的端口”。 |
选择入站端口 | 选择“SSH (22)”。 |
删除虚拟机时删除公共IP和 NIC | 保持复选框未选中。 |
启用加速联网 | 保持复选框未选中。 |
负载均衡选项 | 选择“无”。 |
查看和创建
调用 Voyage API 终结点
提出请求。
您可以使用以下终结点向 Voyage API发出请求:http://{voyage-app-vnet-private-ip}/embeddings。
curl -X GET "http://10.0.0.4/embeddings" \ -H "Content-Type: application/json" \ -d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}
有关所有终结点参数,请参阅API参考。
删除 Voyage API应用程序
要删除您的 Voyage API终结点,请转到您的应用程序,然后单击概述部分中的删除按钮。在出现的对话框中,单击“是”确认删除。此操作还会删除关联的托管资源群组。
删除 Bastion 虚拟机
如果您已预配堡垒虚拟机,删除该虚拟机,以免产生不必要的成本和意外费用。