文本嵌入

Embedding and Reranking API处于预览版中。在预览期间，该功能和相应的文档可能随时更改。

Voyage AI 的文本嵌入模型可将文本转换为可捕获语义的高维向量。这些模型本质上是多语言的，这意味着文本的语义相似性与语言无关。使用以下模型为您的AI搜索应用程序提供最先进的检索精度。

可用型号

Voyage AI提供以下文本嵌入模型：

通用模型

模型	上下文长度	维度	说明
`voyage-4-large`	32,000 tokens	1024（默认）、256、512、2048	最佳的通用和多语言检索质量。使用 4 系列创建的所有嵌入都彼此兼容。要学习更多信息，请参阅博客文章。
`voyage-4`	32,000 tokens	1024（默认）、256、512、2048	针对通用和多语言检索质量进行了优化。使用 4 系列创建的所有嵌入都彼此兼容。要学习；了解更多信息，请参阅博客文章。。
`voyage-4-lite`	32,000 tokens	1024（默认）、256、512、2048	针对延迟和费用进行了优化。使用 4 系列创建的所有嵌入都彼此兼容。要学习；了解更多信息，请参阅博客文章。。

特定领域模型

模型	上下文长度	维度	说明
`voyage-code-3`	32,000 tokens	1024（默认）、256、512、2048	针对代码检索和文档编制进行了优化。要学习；了解更多信息，请参阅博客文章。。
`voyage-finance-2`	32,000 tokens	1024	针对财经检索和 RAG 应用程序进行了优化。要学习；了解更多信息，请参阅博客文章。。
`voyage-law-2`	16,000 tokens	1024	针对合法检索和 RAG 应用程序进行了优化。要学习；了解更多信息，请参阅博客文章。。

开放模型

模型	上下文长度	维度	说明
`voyage-4-nano`	32,000 tokens	512（默认）、128、256	Hushing Face 上提供了开放权重模型。使用 4 系列创建的所有嵌入都彼此兼容要学习；了解更多信息，请参阅博客文章。。

仍可通过API访问以下旧模型，但建议使用上述新模型，以提高质量和效率。

我们的最新模型在质量、上下文长度、延迟和吞吐量等各个方面都比旧版模型表现更好。

模型	上下文长度	维度	说明
`voyage-3-large`	32,000 tokens	1024（默认）、256、512、2048	上一个一代文本嵌入，可实现通用和多语言检索质量。要学习；了解更多信息，请参阅博客文章。。
`voyage-3.5`	32,000 tokens	1024（默认）、256、512、2048	上一个一代文本嵌入针对通用和多语言检索质量进行了优化。要学习；了解更多信息，请参阅博客文章。。
`voyage-3.5-lite`	32,000 tokens	1024（默认）、256、512、2048	上一个一代文本嵌入针对延迟和费用进行了优化。要学习；了解更多信息，请参阅博客文章。。
`voyage-code-2`	16,000 tokens	1536	针对代码检索进行了优化（比替代方案好 17%）。上一个一代代码嵌入。要学习；了解更多信息，请参阅博客文章。。

有关使用文本嵌入的教程，请参阅以下资源：

语言

来年

上下文化数据块嵌入