为提供的文本输入创建向量嵌入。此端点接受单个文本字符串或文本字符串列表,并返回其相应的向量嵌入。
对于语义搜索和检索任务,请将 input_type 参数设立为 query 或 document,以优化模型创建向量的方式。
body
必需
-
要使用的嵌入模型。推荐模型:
voyage-4-large、voyage-4、voyage-4-lite、voyage-code-3、voyage-finance-2、voyage-law-2。值为
voyage-context-3、voyage-4、voyage-4-lite、voyage-4-large、voyage-3.5、voyage-3.5-lite、voyage-3-large、voyage-code-3、voyage-multimodal-3、voyage-finance-2、voyage-law-2或voyage-code-2。 -
输入文本的类型。使用此参数可优化语义搜索和检索任务的嵌入。
选项:
null(默认):模型直接将输入转换为数值向量,而无需任何额外提示。query:当输入内容表示搜索查询时使用。该模型会在前面添加“Represent the 查询 for retrieving supporting 文档:”,以优化用于检索的嵌入。document:当输入内容表示要搜索的文档时使用。该模型会在前面添加“Represent the 文档 forretries:”,以优化用于检索的嵌入。
对于语义搜索和检索任务,请务必根据情况将此参数设立为
query或document。使用和不使用input_type参数生成的嵌入是兼容的。值为
query、document或 null。 -
是否截断超过上下文长度的输入文本。
true(默认):超过上下文长度的输入文本会在矢量化之前自动截断。false:如果任何输入文本超过上下文长度,则会返回错误。
默认值为
true。 -
输出嵌入的维数。
大多数模型仅支持单个默认维度。模型
voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite和voyage-code-3支持以下值:256、512、1024(默认)、和 2048。设置为
null以使用模型的默认维度。值为
256、512、1024、2048或 null。 -
返回的嵌入的数据类型。
选项:
float(默认):32 位单精度浮点数。提供最高的精度和检索准确度。所有型号均支持。int8:8 位有符号整数,范围从 -128 到 127。由voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite和voyage-code-3支持。uint8:从 0 到 255 的 8 位无符号整数。由voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite和voyage-code-3支持。binary:位打包、量化的单位嵌入值,表示为int8。返回的列表长度为output_dimension的 1/8。使用偏移二进制方法。由voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite和voyage-code-3支持。ubinary:位打包、量化的单位嵌入值,表示为uint8。返回的列表长度为output_dimension的 1/8。由voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite和voyage-code-3支持。
取值为
float、int8、uint8、binary或ubinary。默认值为float。 -
响应中嵌入的编码格式。
选项:
null(默认):嵌入以数组形式返回。当output_dtype为float时,每个嵌入都是一个浮点数数组。对于其他output_dtype值(int8、uint8、binary、ubinary),每个嵌入都是一个整数数组。base64:嵌入以 Base64 编码的 NumPy 数组的形式返回,具有以下数据类型:numpy.float32当output_dtype为float时numpy.int8当output_dtype为int8或binary时numpy.uint8当output_dtype为uint8或ubinary时
值为
base64或 null。
curl \
--request POST 'https://ai.mongodb.com/v1/embeddings' \
--header "Authorization: Bearer $ACCESS_TOKEN" \
--header "Content-Type: application/json" \
--data '{"input":"string","model":"voyage-context-3","input_type":"query","truncation":true,"output_dimension":256,"output_dtype":"float","encoding_format":"base64"}'
{
"input": "string",
"model": "voyage-context-3",
"input_type": "query",
"truncation": true,
"output_dimension": 256,
"output_dtype": "float",
"encoding_format": "base64"
}
{
"object": "list",
"data": [
{
"object": "embedding",
"embedding": [
42.0
],
"index": 42
}
],
"model": "string",
"usage": {
"total_tokens": 42
}
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}