Voyage AI의 텍스트 임베딩 모델은 텍스트를 의미론적 의미를 포착하는 고차원 벡터로 변환합니다. 모델은 본질적으로 다국어를 지원하므로 언어 와 관계없이 텍스트의 의미론적 유사성을 갖습니다. 다음 모델을 사용하여 최신 검색 정확도로 AI 검색 애플리케이션을 강화하세요.
사용 가능한 모델
Voyage AI 다음과 같은 텍스트 임베딩 모델을 제공합니다.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 최고의 범용 및 다국어 검색 품질을 제공합니다. 4 시리즈로 생성된 모든 임베딩은 서로 호환됩니다. |
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 범용 및 다국어 검색 품질에 최적화되어 있습니다. 4 시리즈로 생성된 모든 임베딩은 서로 호환됩니다. |
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 지연 시간 과 비용 에 최적화되었습니다. 4 시리즈로 생성된 모든 임베딩은 서로 호환됩니다. |
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 코드 검색 및 문서화에 최적화되었습니다. |
| 32,000 tokens | 1024 | 금융 조회 및 RAG 애플리케이션에 최적화되어 있습니다. |
| 16,000 tokens | 1024 | 법적 조회 및 RAG 애플리케이션에 최적화되어 있습니다. |
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 512 (기본값), 128, 256 | 허깅 페이스에서 사용할 수 있는 오픈 웨이트 모델. 시리즈로 생성된 모든 4 임베딩은 서로 호환됩니다. |
최신 모델은 품질, 컨텍스트 길이, 지연 시간, 처리량 등 모든 측면에서 레거시 모델보다 나은 성능을 발휘합니다.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 범용 및 다국어 검색 품질을 위한 이전 세대 텍스트 임베딩입니다. |
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 범용 및 다국어 검색 품질에 최적화된 이전 세대 텍스트 임베딩입니다. |
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 지연 시간 과 비용 에 최적화된 이전 세대 텍스트 임베딩입니다. |
| 16,000 tokens | 1536 | 코드 검색에 최적화되었습니다(대안보다 17% 우수). 이전 세대 코드 임베딩. |
Tutorials
텍스트 임베딩 사용에 대한 튜토리얼은 다음 리소스를 참조하세요.