Un reranker recibe una consulta y varios documentos, y devuelve una lista ordenada según la relevancia entre la consulta y los documentos. Los documentos suelen ser los resultados preliminares de un sistema de recuperación basadoen incrustación, y el reranker refina las clasificaciones de estos documentos candidatos y proporciona puntajes de relevancia más precisos.
A diferencia de los modelos de incrustación que codifican consultas y documentos por separado, los rerankers son codificadores cruzados que procesan conjuntamente la consulta y el documento, lo que permite una predicción de relevancia más precisa. Aplique un reranker a los principales candidatos recuperados mediante búsquedas basadas en incrustación o con algoritmos de búsqueda léxica como BM25 y TF-IDF.
Modelos disponibles
Modelo | Longitud del contexto | Descripción |
|---|---|---|
| 32,000 | Precisión más alta. Recomendado para la mayoría de las aplicaciones. Para obtener más información, consulte la publicación del blog. |
| 32,000 | Modelo rápido y rentable optimizado para aplicaciones sensibles a la latencia. Para obtener más información, consulte la entrada de blog. |
Nuestros últimos modelos funcionan mejor que los modelos anteriores en todos los aspectos, como calidad, duración del contexto, latencia y rendimiento.
Modelo | Longitud del contexto | Descripción |
|---|---|---|
| 16,000 tokens | Nuestro reranker generalista de segunda generación optimizado para la calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog. |
| 8,000 tokens | Nuestro reranker generalista de segunda generación optimizado tanto para latencia como para calidad con soporte multilingüe. Para obtener más información, consulte la entrada de blog. |
Tutorials
Para obtener tutoriales sobre el uso de rerankers, consulte los siguientes recursos: