Voyage AI 최신 임베딩 및 모델 재순위 지정 기능을 제공합니다. MongoDB의 Embedding and Reranking API 최신 Voyage AI 모델에 대한 액세스 제공합니다. 이 페이지에서는 사용 가능한 모델과 해당 모델을 사용해야 하는 경우에 대해 설명합니다.
텍스트 임베딩의 경우 다음을 권장합니다.
voyage-4-large최상의 품질을 위해voyage-4-lite지연 시간 과 비용 최소화할 수 있습니다.voyage-4품질과 성능 간의 균형을 위해
다른 사용 사례의 경우 다음을 권장합니다.
voyage-multimodal-3.5텍스트, 이미지 및 동영상 임베딩용voyage-context-3청크 수준 및 문서 수준 검색 작업용rerank-2.5대부분의 애플리케이션에 순위 재지정 추가rerank-2.5-lite지연 시간에 민감한 애플리케이션에 순위 재지정 추가
텍스트 임베딩
Voyage AI 텍스트의 의미론적 의미를 캡처하기 위해 다음과 같은 텍스트 임베딩 모델을 제공합니다.
자세한 내용 및 사용 예시 텍스트 임베딩을 참조하세요.
범용 모델
대부분의 AI 검색 애플리케이션에는 다음 모델을 사용하세요.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 최고의 범용 및 다국어 검색 품질을 제공합니다. 4 시리즈로 생성된 모든 임베딩은 서로 호환됩니다. |
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 범용 및 다국어 검색 품질에 최적화되어 있습니다. 4 시리즈로 생성된 모든 임베딩은 서로 호환됩니다. |
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 지연 시간 과 비용 에 최적화되었습니다. 4 시리즈로 생성된 모든 임베딩은 서로 호환됩니다. |
도메인별 모델
정확도를 높이려면 특수 도메인에 다음 모델을 사용하세요.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 코드 검색 및 문서화에 최적화되었습니다. |
| 32,000 tokens | 1024 | 금융 조회 및 RAG 애플리케이션에 최적화되어 있습니다. |
| 16,000 tokens | 1024 | 법적 조회 및 RAG 애플리케이션에 최적화되어 있습니다. |
모델 열기
Voyage는 다음과 같은 개방 가중치 모델도 제공합니다.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 512 (기본값), 128, 256 | 허깅 페이스에서 사용할 수 있는 오픈 웨이트 모델. 시리즈로 생성된 모든 4 임베딩은 서로 호환됩니다. |
최신 모델은 품질, 컨텍스트 길이, 지연 시간, 처리량 등 모든 측면에서 레거시 모델보다 더 나은 성능을 발휘합니다.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 범용 및 다국어 검색 품질을 위한 이전 세대 텍스트 임베딩입니다. |
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 범용 및 다국어 검색 품질에 최적화된 이전 세대 텍스트 임베딩입니다. |
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 지연 시간 과 비용 에 최적화된 이전 세대 텍스트 임베딩입니다. |
| 16,000 tokens | 1536 | 코드 검색에 최적화되었습니다(대안보다 17% 우수). 이전 세대 코드 임베딩. |
상황별 청크 임베딩
Voyage AI 검색 정확도를 높이기 위해 주변 컨텍스트를 통합하면서 임베딩을 생성하는 다음과 같은 모델을 제공합니다.
자세한 내용 및 사용 예시 상황별 청크 임베딩을 참조하세요.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | 범용 및 다국어 검색 품질에 최적화된 상황별 청크 임베딩입니다. |
멀티모달 임베딩
Voyage AI 텍스트, 이미지, 동영상을 프로세스 다음과 같은 임베딩 모델을 제공합니다.
자세한 내용 및 사용 예시 멀티모달 임베딩을 참조하세요.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 (기본값), 256, 512, 2048 | PDF, 슬라이드, 표, 그림, 동영상 등의 스크린샷과 같이 인터리브 처리된 텍스트와 시각 데이터를 벡터화할 수 있는 풍부한 멀티모달 임베딩 모델입니다. |
최신 모델은 품질, 컨텍스트 길이, 지연 시간, 처리량 등 모든 측면에서 레거시 모델보다 더 나은 성능을 발휘합니다.
모델 | 컨텍스트 길이 | 차원 | 설명 |
|---|---|---|---|
| 32,000 tokens | 1024 | 텍스트와 이미지를 통합 임베딩으로 처리합니다. 50,000 ~ 2 백만 픽셀의 이미지를 지원합니다. |
Rerankers
Voyage AI 검색 결과를 세분화하기 위해 다음과 같은 순위 재지정 모델을 제공합니다.
자세한 내용 및 사용 예시 리랭커를 참조하세요.
모델 | 컨텍스트 길이 | 설명 |
|---|---|---|
| 32,000 | 최고의 정확도. 대부분의 애플리케이션에 권장됩니다. |
| 32,000 | 지연 시간에 민감한 애플리케이션에 최적화된 빠르고 비용 효율적인 모델입니다. |
최신 모델은 품질, 컨텍스트 길이, 지연 시간, 처리량 등 모든 측면에서 레거시 모델보다 더 나은 성능을 발휘합니다.
모델 | 컨텍스트 길이 | 설명 |
|---|---|---|
| 16,000 tokens | 다국어 지원 통해 품질에 최적화된 당사의 일반주의 2세대 reranker입니다. |
| 8,000 tokens | 다국어 지원 통해 지연 시간 과 품질 모두에 최적화된 범용 2세대 리랭커입니다. |
가격
모델 가격은 사용량을 기준으로 책정되며, 액세스 에 사용되는 API 키에 연결된 Atlas 계정으로 요금이 청구됩니다. 모든 모델에는 무료 계층 포함되어 있습니다. 대부분의 모델은 200 백만 개의 무료 토큰으로, 특수 모델의 경우 50 백만 개의 토큰으로 시작하세요.
가격은 문서 및 쿼리에 있는 토큰 수를 기준으로 책정됩니다. 무료 계층 에는 대부분의 모델에 대해 200 백만 개의 토큰이 포함되어 있으며 voyage-finance-2, voyage-law-2, voyage-code-2 특수 모델에 대한 50 백만 개의 토큰이 포함되어 있습니다.
모델 | Price per 1K tokens | Price per 1M tokens | 무료 토큰 |
|---|---|---|---|
| $0.00012 | $0.12 | 200 백만 |
| $0.00006 | $0.06 | 200 백만 |
| $0.00002 | $0.02 | 200 백만 |
| $0.00018 | $0.18 | 200 백만 |
| $0.00018 | $0.18 | 200 백만 |
voyage-finance-2voyage-law-2voyage-code-2 | $0.00012 | $0.12 | 50 백만 |
가격은 문서 및 쿼리에 있는 토큰 수를 기준으로 책정됩니다.
모델 | Price per 1K tokens | Price per 1M tokens | 무료 토큰 |
|---|---|---|---|
| $0.00018 | $0.18 | 200 백만 |
가격은 텍스트 토큰과 이미지 픽셀을 기준으로 책정됩니다. 무료 계층 에는 멀티모달 모델을 위한 200 백만 텍스트 토큰과 150 10억 픽셀이 포함되어 있습니다. 이미지는 50,000 픽셀(최소)~ 2 백만 픽셀(최대) 사이에서 처리되며, 비용은 이미지당 $0.00003 ~$0.0012 입니다. 가격 책정을 위해 각 비디오 프레임은 이미지로 간주됩니다.
참고
50,000 픽셀 미만인 이미지는 50,000화소 이미지로 업스케일링, 처리 및 청구됩니다. 2 백만 개 이상의 픽셀이 포함된 이미지는 다운샘플링되어 2 백만 픽셀 이미지로 요금이 청구됩니다.
모델 | Price per 1M tokens | Price per 1B pixels | 무료 계층 |
|---|---|---|---|
| $0.12 | $0.60 | 200M 토큰, 150B 픽셀 |
이미지 해상도 | 픽셀 수 | 이미지당 가격 | Price per 1K images |
|---|---|---|---|
200px × 200px | 40,000 | $0.00003 | $0.03 |
1000px × 1000px | 1 백만 | $0.0006 | $0.60 |
2000px × 2000px | 4 백만 | $0.0012 | $1.20 |
4000px × 4000px | 16 백만 | $0.0012 | $1.20 |
예시
1,000 텍스트 토큰($0.00012) 및 두 개의 4 백만 픽셀 이미지(2 × $0.0012)를 사용하여 단일 입력을 벡터화하는 데 드는 비용 은 $0.00252입니다.
가격은 처리된 총 토큰을 기준으로 하며 (query tokens × number of documents) + sum of tokens in all documents로 계산됩니다. 무료 계층 에는 최신 reranker 모델에 대한 200 백만 토큰이 포함되어 있습니다.
모델 | Price per 1K tokens | Price per 1M tokens | Est. price per request* | 무료 토큰 |
|---|---|---|---|---|
| $0.00005 | $0.05 | $0.0025 | 200 백만 |
| $0.00002 | $0.02 | $0.001 | 200 백만 |
* 예상 가격은 요청 당 100 문서를 가정하여 쿼리 토큰과 문서 당 토큰의 합계가 500입니다.