Voyage AI提供最先进的嵌入和重新排名模型。MongoDB 的 Embedding and Reranking API提供对最新 Voyage AI模型的访问权限。本页介绍可用模型以及何时使用这些模型。
对于文本嵌入,我们建议:
voyage-4-large以获得最佳质量voyage-4-lite以实现最低的延迟和费用voyage-4在质量和性能之间取得平衡如果您的应用程序位于列出的域之一,则为 特定于域的模型。
对于其他使用案例,我们建议:
voyage-multimodal-3.5用于文本、图像和视频嵌入voyage-context-3用于数据块级和文档级检索任务rerank-2.5用于为大多数应用程序添加重新排名功能rerank-2.5-lite用于为延迟敏感的应用程序添加重新排名功能
文本嵌入
Voyage AI提供以下文本嵌入模型来捕获文本的语义。
有关详细信息和示例用法,请参阅文本嵌入。
通用模型
对于大多数AI搜索和检索应用程序,请使用以下模型。
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 1024(默认)、256、512、2048 | 最佳的通用和多语言检索质量。使用 4 系列创建的所有嵌入都彼此兼容。 要学习更多信息,请参阅博客文章。 |
| 32,000 tokens | 1024(默认)、256、512、2048 | 针对通用和多语言检索质量进行了优化。使用 4 系列创建的所有嵌入都彼此兼容。 要学习;了解更多信息,请参阅博客文章。。 |
| 32,000 tokens | 1024(默认)、256、512、2048 | 针对延迟和费用进行了优化。使用 4 系列创建的所有嵌入都彼此兼容。 要学习;了解更多信息,请参阅博客文章。。 |
特定领域模型
将以下模型用于专门领域,以实现更高的准确性。
开放模型
Voyage 还提供以下开放权重模型。
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 512(默认)、128、256 | Hushing Face 上提供了开放权重模型。使用 4 系列创建的所有嵌入都彼此兼容 要学习;了解更多信息,请参阅博客文章。。 |
最新模型在质量、上下文长度、延迟和吞吐量等各个方面都比旧版模型表现更好。
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 1024(默认)、256、512、2048 | 上一个一代文本嵌入,可实现通用和多语言检索质量。 要学习;了解更多信息,请参阅博客文章。。 |
| 32,000 tokens | 1024(默认)、256、512、2048 | 上一个一代文本嵌入针对通用和多语言检索质量进行了优化。 要学习;了解更多信息,请参阅博客文章。。 |
| 32,000 tokens | 1024(默认)、256、512、2048 | 上一个一代文本嵌入针对延迟和费用进行了优化。 要学习;了解更多信息,请参阅博客文章。。 |
| 16,000 tokens | 1536 | 针对代码检索进行了优化(比替代方案好 17%)。上一个一代代码嵌入。 要学习;了解更多信息,请参阅博客文章。。 |
上下文化数据块嵌入
Voyage AI提供以下模型,这些模型可生成嵌入,同时结合周围的上下文,从而提高检索准确性。
有关详细信息和示例用法,请参阅上下文化数据块嵌入。
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 1024(默认)、256、512、2048 | 针对通用和多语言检索质量优化的上下文化数据块嵌入。 要学习更多信息,请参阅博客文章。 |
多模态嵌入
Voyage AI提供以下用于进程文本、图像和视频的嵌入模型。
有关详细信息和示例用法,请参阅多模态嵌入。
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 1024(默认)、256、512、2048 | 丰富的多模态嵌入模型,可以矢量化交错的文本和视觉数据,例如 PDF 的屏幕截图、幻灯片、表格、数字、视频等。 要学习;了解更多信息,请参阅博客文章。。 |
最新模型在质量、上下文长度、延迟和吞吐量等各个方面都比旧版模型表现更好。
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 1024 | 将文本和图像处理为统一的嵌入。支持从 50、000 到 2 百万像素的图像。 要学习;了解更多信息,请参阅博客文章。。 |
重排序器
Voyage AI提供以下重新排名模型来优化搜索结果。
有关详细信息和示例用法,请参阅重排序。
定价
模型定价基于使用量,费用计入与用于访问权限的API密钥关联的Atlas帐户。所有型号均包含免费套餐。为大多数模型提供 200 百万个免费令牌,为专用模型提供 50 百万个令牌。
定价基于文档和查询中的令牌数量。免费套餐包括适用于大多数模型的 200 百万个令牌,以及适用于以下专用模型的 50 百万个令牌:voyage-finance-2、voyage-law-2、voyage-code-2。
模型 | Price per 1K tokens | Price per 1M tokens | 免费令牌 |
|---|---|---|---|
| $ 0.00012 | $ 0.12 | 200 百万 |
| $ 0.00006 | $ 0.06 | 200 百万 |
| $ 0.00002 | $ 0.02 | 200 百万 |
| $ 0.00018 | $ 0.18 | 200 百万 |
| $ 0.00018 | $ 0.18 | 200 百万 |
voyage-finance-2voyage-law-2voyage-code-2 | $ 0.00012 | $ 0.12 | 50 百万 |
定价基于文档和查询中的令牌数量。
模型 | Price per 1K tokens | Price per 1M tokens | 免费令牌 |
|---|---|---|---|
| $ 0.00018 | $ 0.18 | 200 百万 |
定价基于文本标记和图像像素。免费套餐包括用于多模式模型的 200 万个文本令牌和 150 十亿个像素。图像的处理量介于 50、000 像素(最小)到 2 百万像素(最大)之间,每张图像的成本从 0.00003 美元到 0.0012 美元不等。出于定价目的,每个视频帧都被视为一张图像。
注意
少于 50,000 像素的图像将作为 50,000 像素图像进行放大和处理并计费。包含超过 2 百万像素的图像将进行下采样,并作为 2 百万像素图像收费。
模型 | Price per 1M tokens | Price per 1B pixels | 免费层 |
|---|---|---|---|
| $ 0.12 | $ 0.60 | 200M 个词元,150B 个像素 |
图像分辨率 | 像素数 | 每张图片的价格 | Price per 1K images |
|---|---|---|---|
200px × 200px | 40 , 000 | $ 0.00003 | $ 0.03 |
1000px × 1000px | 1 百万 | $ 0.0006 | $ 0.60 |
2000px × 2000px | 4 百万 | $ 0.0012 | $ 1.20 |
4000px × 4000px | 16 百万 | $ 0.0012 | $ 1.20 |
例子
使用 1、000 文本标记对单个输入进行向量化的费用($0.00012)两张 4 百万像素图像 (2 × $0.0012) 的价格为 $0.00252。
定价基于已处理的令牌总数,计算公式为 (query tokens × number of documents) + sum of tokens in all documents。免费套餐包括用于最新重排序模型的 200 万个令牌。
模型 | Price per 1K tokens | Price per 1M tokens | Est. price per request* | 免费令牌 |
|---|---|---|---|---|
| $ 0.00005 | $ 0.05 | $ 0.0025 | 200 百万 |
| $ 0.00002 | $ 0.02 | $ 0.001 | 200 百万 |
* 估算价格假定每个请求100 个文档,查询令牌和每个文档令牌的总和总计为 500。