您可以使用Azure托管应用程序 将 Voyage AI模型部署为客户Azure帐户和虚拟网络 (VNet) 中的实时推理API端点。 Azure托管应用程序具有以下主要优势:
数据流和访问权限控制:数据永远不会离开虚拟网络,从而解决与第三方或多租户服务相关的数据隐私风险。
由Azure支持的可靠性和合合规: Azure作为您唯一的分处理者,因此您可以继承 Azure 的所有可靠性和合合规ACID 一致性保证。
通过Azure进行计费和支付:使用现有的Azure账单信息和积分来购买 Voyage AI模型,无需管理单独的第三方支付和计费系统。
可用型号
要查看可以部署哪些模型,请在Azure市场中搜索“Voyage AI by MongoDB ”。
要学习;了解有关 Voyage AI模型的详情,请参阅 模型概述。
定价
使用 Voyage AI模型的Azure托管应用程序按小时计费。每小时总费用是虚拟机 (VM) 价格(5 美元/小时)和您所在地区的根本的实例价格的总和。此托管Azure应用程序没有管理费用,因此列出的Azure托管应用程序每月价格为 0 美元。
先决条件
要部署Voyage Azure托管应用程序,您必须具备以下条件:
如果您满足所有先决条件,请跳至“在虚拟网络中部署 Voyage API端点”部分。
Quota
本节包括如何检查配额并在必要时请求增加配额的指导。如果您有足够的配额,请跳过本节。
Check Quota
请求增加配额
在所需订阅的“使用量 + 配额”页面中,您可以请求增加配额:
创建虚拟网络
如果您已有虚拟网络想要在其中部署Voyage Azure托管应用程序,请跳过本节。
在虚拟网络中部署 Voyage API端点
在本部分中,您将在虚拟网络中部署Voyage Azure托管应用程序。
如果您在从Azure市场部署 Voyage API端点时需要帮助,联系MongoDB支持。
访问 Voyage API端点
部署后,同一虚拟网络中的任何服务都可以通过HTTP请求访问 Voyage API端点。
创建 Bastion 虚拟机
为了演示如何访问权限Voyage API端点,我们将在同一虚拟网络中创建一个堡垒虚拟机。如果您想使用或让网络中的其他现有计算机/服务器来查询模型端点,您可以跳过本节并跳转到 Invoke Voyage API Endpoint(调用 Voyage API 端点)部分。
此过程将引导您完成低成本虚拟机配置,但仅用于演示目的。如果您是高级用户,则可以进行自定义配置。
基础
填写“Basics”(基础)标签页中的字段。完成后,单击“下一步”。
字段 | 值 |
|---|---|
订阅 | 选择您的订阅。 |
资源群组 | 选择包含您的 Voyage API端点的资源群组。 |
虚拟机名称 | 为您的虚拟机命名。 |
区域 | 选择您的 Voyage API端点所在的地区。 |
可用性选项 | 选择“无需基础架构冗余” |
安全类型 | 选择“标准”。 |
Image | 选择“Ubuntu Server 24.04 LTS - x64 Gen2”。 |
虚拟机架构 | 选择“x64”。 |
使用Azure Spot 折扣运行 | 保持复选框未选中。 |
size | 选择“Standard_B1s - 1 vcpu, 1GiB 内存”。 |
启用休眠 | 保持复选框未选中。 |
身份验证类型 | 选择“SSH 公钥”。 |
用户名 | 输入“航程”。 |
SSH 公钥源 | 选择“生成新的密钥对”。 |
SSH 密钥类型 | 选择“RSA SSH 格式”。 |
密钥对名称 | 输入“vm-voyage_key”。 |
公共入站端口 | 选择“允许选定的端口”。 |
选择入站端口 | 选择“SSH (22)”。 |
磁盘
填写“Disks”(磁盘)标签页中的字段。完成后,单击“下一步”以转到“网络”。
字段 | 值 |
|---|---|
托管加密 | 保持复选框未选中。 |
OS disk size | 选择“默认映像 (30 GiB)”。 |
OS disk type | 选择“标准 HDD(本地冗余存储)”。 |
使用虚拟机删除 | 选中复选框。 |
密钥管理 | 选择“平台托管密钥”。 |
启用超级磁盘兼容性 | 保持复选框未选中。 |
网络
填写“网络”标签页中的字段。完成后,单击“查看 + 创建”。
字段 | 值 |
|---|---|
虚拟网络 | 重要提示。选择部署 Voyage API端点的虚拟网络。 |
子网 | 重要提示。选择虚拟网络中部署您的 Voyage API端点的子网。 |
公共 IP | 重要提示。创建新的公共IP。如果不创建此项,您将无法从虚拟网络外部访问权限虚拟机。 |
NIC 网络安全群组 | 选择“基本”。 |
公共入站端口 | 选择“允许选定的端口”。 |
选择入站端口 | 选择“SSH (22)”。 |
删除虚拟机时删除公共IP和 NIC | 保持复选框未选中。 |
启用加速联网 | 保持复选框未选中。 |
负载均衡选项 | 选择“无”。 |
查看和创建
调用 Voyage API端点
提出请求。
您可以使用以下端点向 Voyage API发出请求:http://{voyage-app-vnet-private-ip}/embeddings。
curl -X GET "http://10.0.0.4/embeddings" \ -H "Content-Type: application/json" \ -d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}
删除 Voyage API应用程序
要删除您的 Voyage API端点,请转到您的应用程序,然后单击概述部分中的删除按钮。在出现的对话框中,单击“是”确认删除。此操作还会删除关联的托管资源群组。
删除 Bastion 虚拟机
如果您已预配堡垒虚拟机,删除该虚拟机,以免产生不必要的成本和意外费用。