Reordena una lista de documentos según su relevancia para una consulta.
Este punto final acepta una consulta y una lista de documentos, luego devuelve los documentos ordenados por puntaje de relevancia en orden descendente.
Cuerpo
Requerido
-
La consulta de búsqueda como una cadena.
Longitud máxima de consulta:
- 8,000 tokens para
rerank-2.5yrerank-2.5-lite - 4,000 tokens for
rerank-2 - 2,000 tokens for
rerank-2-lite
La longitud mínima es
1. - 8,000 tokens para
-
Una lista de documentos que deben reclasificarse, proporcionada como cadenas.
Restricciones:
- Número máximo de documentos: 1,000
- Máximo de tokens por par de consulta + documento:
- 32,000 para
rerank-2.5yrerank-2.5-lite - 16,000 para
rerank-2 - 8,000 para
rerank-2-lite
- 32,000 para
- Total máximo de tokens (tokens de consulta × número de documentos + suma de todos los tokens de documentos):
- 600K para
rerank-2.5,rerank-2.5-lite,rerank-2yrerank-2-lite
- 600K para
Al menos
1pero no más de1000elementos. La longitud mínima de cada uno es1. -
Modelo de reordenamiento a utilizar. Modelos recomendados:
rerank-2.5,rerank-2.5-lite.Los valores son
rerank-2.5,rerank-2.5-lite,rerank-2orerank-2-lite. -
El número de documentos más relevantes que se devolverán. Si no se especifica, se devolverán todos los documentos con sus puntuaciones de reclasificación.
El valor mínimo es
1. -
Si se incluirá el texto del documento en la respuesta.
false(predeterminado): devuelve solo{"index", "relevance_score"}para cada documentotrue: Devuelve{"index", "document", "relevance_score"}para cada documento
El valor predeterminado es
false. -
Si desea truncar las entradas que exceden el límite de longitud del contexto.
true(predeterminado): la consulta y los documentos se truncan automáticamente para ajustarse al límite de longitud del contexto.false:Se devuelve un error si la consulta o cualquier par consulta-documento excede el límite de longitud del contexto.
El valor predeterminado es
true.
curl \
--request POST 'https://ai.mongodb.com/v1/rerank' \
--header "Authorization: Bearer $ACCESS_TOKEN" \
--header "Content-Type: application/json" \
--data '{"query":"string","documents":["string"],"model":"rerank-2.5","top_k":42,"return_documents":false,"truncation":true}'
{
"query": "string",
"documents": [
"string"
],
"model": "rerank-2.5",
"top_k": 42,
"return_documents": false,
"truncation": true
}
{
"object": "list",
"data": [
{
"index": 42,
"relevance_score": 42.0,
"document": "string"
}
],
"model": "string",
"usage": {
"total_tokens": 42
}
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}