Reclassifica uma lista de documentos com base em sua relevância para uma query.
Esse endpoint aceita uma query e uma lista de documentos e, em seguida, retorna os documentos classificados por pontuação de relevância em ordem decrescente.
corpo, corpo
Obrigatório
-
A query de pesquisa como uma string.
Comprimento máximo da query:
- 8,000 tokens para
rerank-2.5ererank-2.5-lite - 4,000 tokens for
rerank-2 - 2,000 tokens for
rerank-2-lite
O comprimento mínimo é
1. - 8,000 tokens para
-
Uma lista de documentos a serem reclassificados, fornecidos como strings.
Restrições:
- Número máximo de documentos: 1,000
- Máximo de tokens por query + par de documento :
- 32,000 para
rerank-2.5ererank-2.5-lite - 16,000 para
rerank-2 - 8,000 para
rerank-2-lite
- 32,000 para
- Total máximo de tokens (tokens de query × número de documentos + soma de todos os tokens de documento ):
- 600K para
rerank-2.5,rerank-2.5-lite,rerank-2ererank-2-lite
- 600K para
Pelo menos
1, mas não mais de1000elementos. O comprimento mínimo de cada um é1. -
O modelo de reclassificação a ser usado. Modelos recomendados:
rerank-2.5,rerank-2.5-lite.Os valores são
rerank-2.5,rerank-2.5-lite,rerank-2ourerank-2-lite. -
O número de documentos mais relevantes a serem devolvidos. Se não forem especificados, todos os documentos serão retornados com suas pontuações de reclassificação.
O valor mínimo é
1. -
Se incluir o texto do documento na resposta.
false(padrão): retorna apenas{"index", "relevance_score"}para cada documentotrue: retorna{"index", "document", "relevance_score"}para cada documento
O valor padrão é
false. -
Se deve truncar entradas que excedem o limite de comprimento do contexto.
true(padrão): a query e os documentos são automaticamente truncados para caber dentro do limite de comprimento do contexto.false: Um erro será retornado se a query ou qualquer par query-documento exceder o limite de comprimento do contexto.
O valor padrão é
true.
curl \
--request POST 'https://ai.mongodb.com/v1/rerank' \
--header "Authorization: Bearer $ACCESS_TOKEN" \
--header "Content-Type: application/json" \
--data '{"query":"string","documents":["string"],"model":"rerank-2.5","top_k":42,"return_documents":false,"truncation":true}'
{
"query": "string",
"documents": [
"string"
],
"model": "rerank-2.5",
"top_k": 42,
"return_documents": false,
"truncation": true
}
{
"object": "list",
"data": [
{
"index": 42,
"relevance_score": 42.0,
"document": "string"
}
],
"model": "string",
"usage": {
"total_tokens": 42
}
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}