Embedding 및 Reranking API Preview에 있습니다. 기능 및 해당 설명서는 미리 보기 기간에 언제든지 변경될 수 있습니다.
리랭커는 쿼리 와 많은 문서를 수신하고 쿼리 와 문서 간의 관련성 순위 목록을 반환합니다. 문서는 종종 임베딩 기반 검색 시스템의 예비 결과이며, 재순위 지정기는 이러한 후보 문서의 순위를 조정하고 더 정확한 관련성 점수를 제공합니다.
쿼리와 문서를 별도로 인코딩하는 임베딩 모델과 달리 리랭커는 쿼리 와 문서 쌍을 공동으로 프로세스 보다 정확한 관련성 예측을 가능하게 하는 크로스 인코더입니다. 임베딩 기반 검색 또는 BM25 및 TF-IDF와 같은 어휘 검색 알고리즘을 사용하여 조회된 상위 후보에 reranker를 적용합니다.
사용 가능한 모델
모델 | 컨텍스트 길이 | 설명 |
|---|---|---|
| 32,000 | 최고의 정확도. 대부분의 애플리케이션에 권장됩니다. |
| 32,000 | 지연 시간에 민감한 애플리케이션에 최적화된 빠르고 비용 효율적인 모델입니다. |
최신 모델은 품질, 컨텍스트 길이, 지연 시간, 처리량 등 모든 측면에서 레거시 모델보다 나은 성능을 발휘합니다.
모델 | 컨텍스트 길이 | 설명 |
|---|---|---|
| 16,000 tokens | 다국어 지원 통해 품질에 최적화된 당사의 일반주의 2세대 reranker입니다. |
| 8,000 tokens | 다국어 지원 통해 지연 시간 과 품질 모두에 최적화된 범용 2세대 리랭커입니다. |
Tutorials
리랭커 사용에 대한 튜토리얼은 다음 리소스를 참조하세요.