제공된 텍스트 입력에 대한 벡터 임베딩을 생성합니다. 이 엔드포인트는 단일 text string 또는 text string 목록을 허용하고 해당 벡터 임베딩을 반환합니다.
시맨틱 검색 및 조회 작업의 경우 input_type 매개 변수를 query 또는 document 로 설정하여 모델이 벡터를 생성하는 방식을 최적화합니다.
body
필수 사항
입력
string | 배열[string] 필수 사항 단일 텍스트 string 또는 포함할 텍스트 string 목록(예:
["I like cats", "I also like dogs"])입니다.제약 조건:
- 최대 목록 길이: 1,000 항목
- 최대 총 토큰 수:
voyage-3.5-lite및voyage-4-lite의 경우 1M,voyage-3.5,voyage-4및voyage-2의 경우 320K입니다.voyage-3-large,voyage-4-large,voyage-code-3,voyage-finance-2및voyage-law-2의 120K
-
사용할 임베딩 모델입니다. 권장 모델:
voyage-4-large,voyage-4,voyage-4-lite,voyage-code-3,voyage-finance-2,voyage-law-2.값은
voyage-context-3,voyage-4,voyage-4-lite,voyage-4-large,voyage-3.5,voyage-3.5-lite,voyage-3-large,voyage-code-3,voyage-multimodal-3,voyage-finance-2,voyage-law-2또는voyage-code-2입니다. . -
입력 텍스트의 유형입니다. 시맨틱 검색 및 조회 작업에 대한 임베딩을 최적화하려면 이 매개변수를 사용합니다.
옵션:
null(기본값): 모델이 추가 프롬프트 없이 입력을 숫자 벡터로 직접 변환합니다.query: 입력이 검색 쿼리 나타낼 때 사용합니다. 이 모델은 검색을 위한 임베딩을 최적화하기 위해 ' 쿼리 for reterieing supportdocuments:'를 앞에 추가합니다.document: 입력이 검색할 문서 나타낼 때 사용합니다. 이 모델은 검색을 위한 임베딩을 최적화하기 위해 '검색할 문서 표시:'를 추가합니다.
시맨틱 검색 및 조회 작업의 경우 항상 이 매개변수를
query또는document로 적절하게 설정하세요.input_type인수를 사용하거나 사용하지 않고 생성된 임베딩은 호환됩니다.값은
query,document또는 null입니다. -
컨텍스트 길이를 초과하는 입력 텍스트를 자를지 여부입니다.
true(기본값): 컨텍스트 길이를 초과하는 입력 텍스트는 벡터화 전에 자동으로 잘립니다.false: 입력 텍스트가 컨텍스트 길이를 초과하면 오류가 반환됩니다.
기본값은
true입니다. -
출력 임베딩의 차원 수입니다.
대부분의 모델은 하나의 기본값 차원만 지원 .
voyage-4-large,voyage-4,voyage-4-lite,voyage-3-large,voyage-3.5,voyage-3.5-lite및voyage-code-3모델 지원 256, 512, 1024 (기본값), 및 2048.모델의 기본값 차원을 사용하려면
null로 설정합니다.값은
256,512,1024,2048또는 null입니다. -
반환된 임베딩의 데이터 유형 .
옵션:
float(기본값): 32비트 단정밀도 부동 소수점 숫자입니다. 최고의 정밀도와 검색 정확도를 제공합니다. 모든 모델에서 지원됩니다.int8: -128 ~ 127 범위의 8비트 부호 있는 정수입니다.voyage-4-large,voyage-4,voyage-4-lite,voyage-3-large,voyage-3.5,voyage-3.5-lite및voyage-code-3에서 지원됩니다.uint8: 0 ~ 255 범위의 8비트 부호 없는 정수입니다.voyage-4-large,voyage-4,voyage-4-lite,voyage-3-large,voyage-3.5,voyage-3.5-lite및voyage-code-3에서 지원됩니다.binary:int8로 표시되는 비트 압축, 양자화된 단일 비트 임베딩 값입니다. 반환된 목록 길이는output_dimension의 1/8 입니다. 오프셋 바이너리 메서드를 사용합니다.voyage-4-large,voyage-4,voyage-4-lite,voyage-3-large,voyage-3.5,voyage-3.5-lite및voyage-code-3에서 지원됩니다.ubinary:uint8로 표시되는 비트 압축, 양자화된 단일 비트 임베딩 값입니다. 반환된 목록 길이는output_dimension의 1/8 입니다.voyage-4-large,voyage-4,voyage-4-lite,voyage-3-large,voyage-3.5,voyage-3.5-lite및voyage-code-3에서 지원됩니다.
값은
float,int8,uint8,binary또는ubinary입니다. 기본값은float입니다. -
응답에서 임베딩이 인코딩되는 형식입니다.
옵션:
null(기본값): 임베딩이 배열로 반환됩니다.output_dtype가float인 경우 각 임베딩은 부동 소수점 숫자의 배열 입니다. 다른output_dtype값(int8,uint8,binary,ubinary)의 경우 각 임베딩은 정수 배열 입니다.base64: 임베딩이 다음 데이터 유형을 사용하여 Base64로 인코딩된 NumPy 배열로 반환됩니다.numpy.float32output_dtype이float인 경우numpy.int8output_dtype이int8또는binary인 경우numpy.uint8output_dtype이uint8또는ubinary인 경우
값이
base64또는 null입니다.
curl \
--request POST 'https://ai.mongodb.com/v1/embeddings' \
--header "Authorization: Bearer $ACCESS_TOKEN" \
--header "Content-Type: application/json" \
--data '{"input":"string","model":"voyage-context-3","input_type":"query","truncation":true,"output_dimension":256,"output_dtype":"float","encoding_format":"base64"}'
{
"input": "string",
"model": "voyage-context-3",
"input_type": "query",
"truncation": true,
"output_dimension": 256,
"output_dtype": "float",
"encoding_format": "base64"
}
{
"object": "list",
"data": [
{
"object": "embedding",
"embedding": [
42.0
],
"index": 42
}
],
"model": "string",
"usage": {
"total_tokens": 42
}
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}