Voyage AI 的文本嵌入模型可将文本转换为可捕获语义的高维向量。这些模型本质上是多语言的,这意味着文本的语义相似性与语言无关。使用以下模型为您的AI搜索应用程序提供最先进的检索精度。
可用型号
Voyage AI提供以下文本嵌入模型:
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 1024(默认)、256、512、2048 | 最佳的通用和多语言检索质量。使用 4 系列创建的所有嵌入都彼此兼容。 |
| 32,000 tokens | 1024(默认)、256、512、2048 | 针对通用和多语言检索质量进行了优化。使用 4 系列创建的所有嵌入都彼此兼容。 |
| 32,000 tokens | 1024(默认)、256、512、2048 | 针对延迟和费用进行了优化。使用 4 系列创建的所有嵌入都彼此兼容。 |
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 1024(默认)、256、512、2048 | 针对代码检索和文档编制进行了优化。 |
| 32,000 tokens | 1024 | 针对财经检索和 RAG 应用程序进行了优化。 |
| 16,000 tokens | 1024 | 针对合法检索和 RAG 应用程序进行了优化。 |
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 512(默认)、128、256 | Hushing Face 上提供了开放权重模型。使用4 系列创建的所有嵌入都彼此兼容 |
我们的最新模型在质量、上下文长度、延迟和吞吐量等各个方面都比传统模型表现更好。
模型 | 上下文长度 | 维度 | 说明 |
|---|---|---|---|
| 32,000 tokens | 1024(默认)、256、512、2048 | 上一个一代文本嵌入,可实现通用和多语言检索质量。 |
| 32,000 tokens | 1024(默认)、256、512、2048 | 上一个一代文本嵌入针对通用和多语言检索质量进行了优化。 |
| 32,000 tokens | 1024(默认)、256、512、2048 | 上一个一代文本嵌入针对延迟和费用进行了优化。 |
| 16,000 tokens | 1536 | 针对代码检索进行了优化(比替代方案好 17%)。上一个一代代码嵌入。 |
Tutorials
有关使用文本嵌入的教程,请参阅以下资源: