重排序器接收查询和许多文档,并返回查询和文档之间相关性的排名列表。这些文档通常是基于 嵌入的检索系统的初步结果,重新排名器会完善这些候选文档的排名并提供更准确的相关性分数。
与分别对查询和文档进行编码的嵌入模型不同,重排序器是交叉编码器,可联合进程一对查询和文档,从而实现更准确的相关性预测。对通过基于嵌入的搜索或词法搜索算法(例如 BM25 和 TF-IDF)检索到的顶级候选排序。
可用型号
模型 | 上下文长度 | 说明 |
|---|---|---|
| 32 , 000 | 最高准确度。推荐用于大多数应用。 |
| 32 , 000 | 快速且经济高效的模型,针对延迟敏感的应用程序进行了优化。 |
我们的最新模型在质量、上下文长度、延迟和吞吐量等各个方面都比传统模型表现更好。
模型 | 上下文长度 | 说明 |
|---|---|---|
| 16,000 tokens | 我们的第二代通用重排序器通过多语言支持对质量进行了优化。 |
| 8,000 tokens | 我们的第二代通用重排序器通过多语言支持对延迟和质量进行了优化。 |
Tutorials
有关使用重排序器的教程,请参阅以下资源: