模型概述

Embedding and Reranking API处于预览版中。在预览期间，该功能和相应的文档可能随时更改。

Voyage AI提供最先进的嵌入和重新排名模型。MongoDB 的 Embedding and Reranking API提供对最新 Voyage AI模型的访问权限。本页介绍可用模型以及何时使用这些模型。

什么是嵌入模型和重排序器？

选择模型

展开此部分，详细学习；了解应为您的使用案例选择哪种模型。

对于文本嵌入，我们建议：

voyage-4-large 以获得最佳质量
voyage-4-lite 以实现最低的延迟和费用
voyage-4 在质量和性能之间取得平衡
如果您的应用程序位于列出的域之一，则为特定于域的模型。

对于其他使用案例，我们建议：

voyage-multimodal-3.5 用于文本、图像和视频嵌入
voyage-context-3 用于数据块级和文档级检索任务
rerank-2.5 用于为大多数应用程序添加重新排名功能
rerank-2.5-lite 用于为延迟敏感的应用程序添加重新排名功能

文本嵌入

Voyage AI提供以下文本嵌入模型来捕获文本的语义。

有关详细信息和示例用法，请参阅文本嵌入。

通用模型

对于大多数AI搜索和检索应用程序，请使用以下模型。

模型	上下文长度	维度	说明
`voyage-4-large`	32,000 tokens	1024（默认）、256、512、2048	最佳的通用和多语言检索质量。使用 4 系列创建的所有嵌入都彼此兼容。要学习更多信息，请参阅博客文章。
`voyage-4`	32,000 tokens	1024（默认）、256、512、2048	针对通用和多语言检索质量进行了优化。使用 4 系列创建的所有嵌入都彼此兼容。要学习；了解更多信息，请参阅博客文章。。
`voyage-4-lite`	32,000 tokens	1024（默认）、256、512、2048	针对延迟和费用进行了优化。使用 4 系列创建的所有嵌入都彼此兼容。要学习；了解更多信息，请参阅博客文章。。

特定领域模型

将以下模型用于专门领域，以实现更高的准确性。

模型	上下文长度	维度	说明
`voyage-code-3`	32,000 tokens	1024（默认）、256、512、2048	针对代码检索和文档编制进行了优化。要学习；了解更多信息，请参阅博客文章。。
`voyage-finance-2`	32,000 tokens	1024	针对财经检索和 RAG 应用程序进行了优化。要学习；了解更多信息，请参阅博客文章。。
`voyage-law-2`	16,000 tokens	1024	针对合法检索和 RAG 应用程序进行了优化。要学习；了解更多信息，请参阅博客文章。。

开放模型

Voyage 还提供以下开放权重模型。

模型	上下文长度	维度	说明
`voyage-4-nano`	32,000 tokens	512（默认）、128、256	Hushing Face 上提供了开放权重模型。使用 4 系列创建的所有嵌入都彼此兼容要学习；了解更多信息，请参阅博客文章。。

较旧的文本嵌入模型

仍可通过API访问以下旧模型，但建议使用新模型，以提高质量和效率。

最新模型在质量、上下文长度、延迟和吞吐量等各个方面都比旧版模型表现更好。

模型	上下文长度	维度	说明
`voyage-3-large`	32,000 tokens	1024（默认）、256、512、2048	上一个一代文本嵌入，可实现通用和多语言检索质量。要学习；了解更多信息，请参阅博客文章。。
`voyage-3.5`	32,000 tokens	1024（默认）、256、512、2048	上一个一代文本嵌入针对通用和多语言检索质量进行了优化。要学习；了解更多信息，请参阅博客文章。。
`voyage-3.5-lite`	32,000 tokens	1024（默认）、256、512、2048	上一个一代文本嵌入针对延迟和费用进行了优化。要学习；了解更多信息，请参阅博客文章。。
`voyage-code-2`	16,000 tokens	1536	针对代码检索进行了优化（比替代方案好 17%）。上一个一代代码嵌入。要学习；了解更多信息，请参阅博客文章。。

上下文化数据块嵌入

Voyage AI提供以下模型，这些模型可生成嵌入，同时结合周围的上下文，从而提高检索准确性。

有关详细信息和示例用法，请参阅上下文化数据块嵌入。

模型	上下文长度	维度	说明
`voyage-context-3`	32,000 tokens	1024（默认）、256、512、2048	针对通用和多语言检索质量优化的上下文化数据块嵌入。要学习更多信息，请参阅博客文章。

多模态嵌入

Voyage AI提供以下用于进程文本、图像和视频的嵌入模型。

有关详细信息和示例用法，请参阅多模态嵌入。

模型	上下文长度	维度	说明
`voyage-multimodal-3.5`	32,000 tokens	1024（默认）、256、512、2048	丰富的多模态嵌入模型，可以矢量化交错的文本和视觉数据，例如 PDF 的屏幕截图、幻灯片、表格、数字、视频等。要学习；了解更多信息，请参阅博客文章。。

较旧的多式联运模型

仍可通过API访问以下旧模型，但建议使用新模型，以提高质量和效率。

最新模型在质量、上下文长度、延迟和吞吐量等各个方面都比旧版模型表现更好。

模型	上下文长度	维度	说明
`voyage-multimodal-3`	32,000 tokens	1024	将文本和图像处理为统一的嵌入。支持从 50、000 到 2 百万像素的图像。要学习；了解更多信息，请参阅博客文章。。

重排序器

Voyage AI提供以下重新排名模型来优化搜索结果。

有关详细信息和示例用法，请参阅重排序。

模型	上下文长度	说明
`rerank-2.5`	32 , 000	最高准确度。推荐用于大多数应用程序。要学习；了解更多信息，请参阅博客文章。。
`rerank-2.5-lite`	32 , 000	快速且经济高效的模型，针对延迟敏感的应用程序进行了优化。要学习；了解更多信息，请参阅博客文章。。

较旧的重新排序

仍可通过API访问以下旧模型，但建议使用新模型，以提高质量和效率。

最新模型在质量、上下文长度、延迟和吞吐量等各个方面都比旧版模型表现更好。

模型	上下文长度	说明
`rerank-2`	16,000 tokens	我们的第二代通用重排序器通过多语言支持对质量进行了优化。要学习；了解更多信息，请参阅博客文章。。
`rerank-2-lite`	8,000 tokens	我们的第二代通用重排序器通过多语言支持对延迟和质量进行了优化。要学习；了解更多信息，请参阅博客文章。。

定价

模型定价基于使用量，费用计入与用于访问权限的API密钥关联的Atlas帐户。所有型号均包含免费套餐。为大多数模型提供 200 百万个免费令牌，为专用模型提供 50 百万个令牌。

定价基于文档和查询中的令牌数量。免费套餐包括适用于大多数模型的 200 百万个令牌，以及适用于以下专用模型的 50 百万个令牌：voyage-finance-2、voyage-law-2、voyage-code-2。

模型	Price per 1K tokens	Price per 1M tokens	免费令牌
`voyage-4-large`	$ 0.00012	$ 0.12	200 百万
`voyage-4`	$ 0.00006	$ 0.06	200 百万
`voyage-4-lite`	$ 0.00002	$ 0.02	200 百万
`voyage-context-3`	$ 0.00018	$ 0.18	200 百万
`voyage-code-3`	$ 0.00018	$ 0.18	200 百万
`voyage-finance-2` `voyage-law-2` `voyage-code-2`	$ 0.00012	$ 0.12	50 百万

较旧的文本嵌入模型

下表显示了旧版文本嵌入模型的定价。不为这些模型提供免费令牌。

模型	Price per 1K tokens	Price per 1M tokens
`voyage-3-large`	$ 0.00018	$ 0.18
`voyage-3.5`	$ 0.00006	$ 0.06
`voyage-3.5-lite`	$ 0.00002	$ 0.02

定价基于文档和查询中的令牌数量。

模型	Price per 1K tokens	Price per 1M tokens	免费令牌
`voyage-context-3`	$ 0.00018	$ 0.18	200 百万

定价基于文本标记和图像像素。免费套餐包括用于多模式模型的 200 万个文本令牌和 150 十亿个像素。图像的处理量介于 50、000 像素（最小）到 2 百万像素（最大）之间，每张图像的成本从 0.00003 美元到 0.0012 美元不等。出于定价目的，每个视频帧都被视为一张图像。

注意

少于 50,000 像素的图像将作为 50,000 像素图像进行放大和处理并计费。包含超过 2 百万像素的图像将进行下采样，并作为 2 百万像素图像收费。

模型	Price per 1M tokens	Price per 1B pixels	免费层
`voyage-multimodal-3.5`	$ 0.12	$ 0.60	200M 个词元，150B 个像素

图像分辨率	像素数	每张图片的价格	Price per 1K images
200px × 200px	40 , 000	$ 0.00003	$ 0.03
1000px × 1000px	1 百万	$ 0.0006	$ 0.60
2000px × 2000px	4 百万	$ 0.0012	$ 1.20
4000px × 4000px	16 百万	$ 0.0012	$ 1.20

例子

使用 1、000 文本标记对单个输入进行向量化的费用($0.00012)两张 4 百万像素图像 (2 × $0.0012) 的价格为 $0.00252。

较旧的多式联运模型

下表显示了旧款多式联运车型的定价。不为这些模型提供免费令牌。

模型	Price per 1M tokens	Price per 1B pixels	免费层
`voyage-multimodal-3`	$ 0.12	$ 0.60	0

定价基于已处理的令牌总数，计算公式为 (query tokens × number of documents) + sum of tokens in all documents。免费套餐包括用于最新重排序模型的 200 万个令牌。

模型	Price per 1K tokens	Price per 1M tokens	Est. price per request*	免费令牌
`rerank-2.5`	$ 0.00005	$ 0.05	$ 0.0025	200 百万
`rerank-2.5-lite`	$ 0.00002	$ 0.02	$ 0.001	200 百万

* 估算价格假定每个请求100 个文档，查询令牌和每个文档令牌的总和总计为 500。

较旧的重新排序

下表显示了旧版重排序器的定价。不为这些模型提供免费令牌。

模型	Price per 1K tokens	Price per 1M tokens	Est. price per request*	免费令牌
`rerank-2`	$ 0.00005	$ 0.05	$ 0.0025	0
`rerank-2-lite`	$ 0.00002	$ 0.02	$ 0.001	0

后退

快速入门

来年

API和客户端