쿼리 와의 관련성에 따라 문서 목록의 순위를 재지정합니다.
이 엔드포인트는 쿼리 와 문서 목록을 수락한 다음 관련성 점수를 기준으로 내림차순으로 정렬된 문서를 반환합니다.
body
필수 사항
-
검색 쿼리 문자열로 반환합니다.
최대 쿼리 길이:
- 8,000
rerank-2.5및rerank-2.5-lite에 대한 토큰 - 4,000 tokens for
rerank-2 - 2,000 tokens for
rerank-2-lite
최소 길이는
1입니다. - 8,000
-
재지정할 문서 목록으로, 문자열로 제공됩니다.
제약 조건:
- 최대 문서 수: 1,000
- 쿼리 당 최대 토큰 + 문서 쌍:
rerank-2.5및rerank-2.5-lite에 대한 32,000- 16,000 for
rerank-2 - 8,000 for
rerank-2-lite
- 최대 총 토큰(쿼리 토큰 × 문서 수 + 모든 문서 토큰의 합계):
rerank-2.5,rerank-2.5-lite,rerank-2및rerank-2-lite의 600K
최소
1개,1000개 이하의 요소입니다. 각각의 최소 길이는1입니다. -
사용할 재순위 모델입니다. 권장 모델:
rerank-2.5,rerank-2.5-lite.값은
rerank-2.5,rerank-2.5-lite,rerank-2또는rerank-2-lite입니다. -
반환할 가장 관련성이 높은 문서의 수입니다. 지정하지 않으면 모든 문서가 순위 재지정 점수와 함께 반환됩니다.
최소값은
1입니다. -
응답에 문서 텍스트를 포함할지 여부입니다.
false(기본값): 각 문서 에 대해{"index", "relevance_score"}만 반환합니다.true: 각 문서 에 대해{"index", "document", "relevance_score"}반환
기본값은
false입니다. -
컨텍스트 길이 제한을 초과하는 입력을 자를지 여부입니다.
true(기본값): 컨텍스트 길이 제한에 맞게 쿼리 와 문서가 자동으로 잘립니다.false: 쿼리 또는 쿼리-문서 쌍이 컨텍스트 길이 제한을 초과하면 오류가 반환됩니다.
기본값은
true입니다.
POST /rerank
curl \
--request POST 'https://ai.mongodb.com/v1/rerank' \
--header "Authorization: Bearer $ACCESS_TOKEN" \
--header "Content-Type: application/json" \
--data '{"query":"string","documents":["string"],"model":"rerank-2.5","top_k":42,"return_documents":false,"truncation":true}'
요청 예시
{
"query": "string",
"documents": [
"string"
],
"model": "rerank-2.5",
"top_k": 42,
"return_documents": false,
"truncation": true
}
응답 예시(200)
{
"object": "list",
"data": [
{
"index": 42,
"relevance_score": 42.0,
"document": "string"
}
],
"model": "string",
"usage": {
"total_tokens": 42
}
}
응답 예시(400)
{
"detail": "string"
}
응답 예시(401)
{
"detail": "string"
}
응답 예시(403)
{
"detail": "string"
}
응답 예시(429)
{
"detail": "string"
}
응답 예시(500)
{
"detail": "string"
}
응답 예시(502)
{
"detail": "string"
}
응답 예시(503)
{
"detail": "string"
}
응답 예시(504)
{
"detail": "string"
}