クエリへの関連性に基づいてドキュメントのリストを再ランク付けします。
このエンドポイントとなる接続されたデバイスはクエリとドキュメントのリストを受け入れ、関連性スコアの降順で並べ替えられたドキュメントを返します。
body
必須
-
stringとしての検索クエリ。
最大クエリ長:
rerank-2.5とrerank-2.5-liteの 8,000 トークン- 4,000 tokens for
rerank-2 - 2,000 tokens for
rerank-2-lite
最小長は
1です。 -
再ランク付けするドキュメントのリスト(string として提供)。
制約:
- ドキュメントの最大数: 1、000
- クエリ +ドキュメントペアあたりの最大トークン:
rerank-2.5とrerank-2.5-liteでは 32、000- の 16,000
rerank-2 - の 8,000
rerank-2-lite
- トークンの最大合計数(クエリ トークン x ドキュメント数 + すべてのドキュメントトークンの合計):
rerank-2.5、rerank-2.5-lite、rerank-2、rerank-2-liteの 600K
少なくとも
1を、1000以下の要素を含めます。各 の最小長は1です。 -
使用する再ランク付けモデル。推奨モデル:
rerank-2.5、rerank-2.5-lite値は、
rerank-2.5、rerank-2.5-lite、rerank-2、またはrerank-2-liteです。 -
返される最も関連性の高いドキュメントの数。指定しない場合、すべてのドキュメントが再ランク化スコアとともに返されます。
の最小値は
1です。 -
応答にドキュメントテキストを含めるかどうか。
false(デフォルト): 各ドキュメントに対して{"index", "relevance_score"}のみを返しますtrue: 各ドキュメントに対して{"index", "document", "relevance_score"}を返します
デフォルト値は
falseです。 -
コンテキストの長さ制限を超える入力を切り捨てるかどうか。
true(デフォルト): クエリとドキュメントは、コンテキストの長さ制限内に収まるように自動的に切り捨てられます。false: クエリまたはクエリとドキュメントのペアがコンテキストの長さ制限を超えると、エラーが返されます。
デフォルト値は
trueです。
POST /rerank
curl \
--request POST 'https://ai.mongodb.com/v1/rerank' \
--header "Authorization: Bearer $ACCESS_TOKEN" \
--header "Content-Type: application/json" \
--data '{"query":"string","documents":["string"],"model":"rerank-2.5","top_k":42,"return_documents":false,"truncation":true}'
リクエスト例
{
"query": "string",
"documents": [
"string"
],
"model": "rerank-2.5",
"top_k": 42,
"return_documents": false,
"truncation": true
}
応答の例(200)
{
"object": "list",
"data": [
{
"index": 42,
"relevance_score": 42.0,
"document": "string"
}
],
"model": "string",
"usage": {
"total_tokens": 42
}
}
応答の例(400)
{
"detail": "string"
}
応答の例(401)
{
"detail": "string"
}
応答の例(403)
{
"detail": "string"
}
応答の例(429)
{
"detail": "string"
}
応答の例(500)
{
"detail": "string"
}
応答の例(502)
{
"detail": "string"
}
応答の例(503)
{
"detail": "string"
}
応答の例(504)
{
"detail": "string"
}