body
必需
-
字符串形式的搜索查询。
最大查询长度:
rerank-2.5和rerank-2.5-lite的 8、000 词元- 4,000 tokens for
rerank-2 - 2,000 tokens for
rerank-2-lite
最小长度为
1。 -
要重新排名的文档列表,以字符串形式提供。
约束条件:
- 最大文档数:1,000
- 每个查询+文档对的最大词元数:
- 32、000(针对
rerank-2.5和rerank-2.5-lite) - 16,000 for
rerank-2 - 8,000 for
rerank-2-lite
- 32、000(针对
- 最大总词元(查询词元 × 文档数量 + 所有文档词元总和):
- 600K 用于
rerank-2.5、rerank-2.5-lite、rerank-2和rerank-2-lite
- 600K 用于
至少
1个但不超过1000个元素。每个的最小长度为1。 -
要使用的重排序模型。推荐型号:
rerank-2.5、rerank-2.5-lite。取值为
rerank-2.5、rerank-2.5-lite、rerank-2或rerank-2-lite。 -
要返回的最相关文档的数量。如果未指定,则返回所有文档及其重新排名分数。
最小值为
1。 -
是否在响应中包含文档文本。
false(默认):仅为每个文档返回{"index", "relevance_score"}true:为每个文档返回{"index", "document", "relevance_score"}
默认值为
false。 -
是否截断超过上下文长度限制的输入。
true(默认):查询和文档会自动截断以适应上下文长度限制。false:如果查询或任何查询-文档对超过上下文长度限制,则会返回错误。
默认值为
true。
POST /rerank
curl \
--request POST 'https://ai.mongodb.com/v1/rerank' \
--header "Authorization: Bearer $ACCESS_TOKEN" \
--header "Content-Type: application/json" \
--data '{"query":"string","documents":["string"],"model":"rerank-2.5","top_k":42,"return_documents":false,"truncation":true}'
请求示例
{
"query": "string",
"documents": [
"string"
],
"model": "rerank-2.5",
"top_k": 42,
"return_documents": false,
"truncation": true
}
响应示例 (200)
{
"object": "list",
"data": [
{
"index": 42,
"relevance_score": 42.0,
"document": "string"
}
],
"model": "string",
"usage": {
"total_tokens": 42
}
}
响应示例 (400)
{
"detail": "string"
}
响应示例 (401)
{
"detail": "string"
}
响应示例 (403)
{
"detail": "string"
}
响应示例 (429)
{
"detail": "string"
}
响应示例 (500)
{
"detail": "string"
}
响应示例 (502)
{
"detail": "string"
}
响应示例 (503)
{
"detail": "string"
}
响应示例 (504)
{
"detail": "string"
}