指定されたテキスト入力に対してベクトル埋め込みを作成します。このエンドポイントとなる接続されたデバイスは、単一のテキスト string またはテキスト string のリストを受け入れ、それに対応するベクトル埋め込みを返します。
セマンティック検索と取得のタスクでは、input_type パラメーターを query または document に設定して、モデルがベクトルを作成する方法を最適化します。
body
必須
-
使用する埋め込みモデル。推奨モデル:
voyage-4-large、voyage-4、voyage-4-lite、voyage-code-3、voyage-finance-2、voyage-law-2値は、
voyage-context-3、voyage-4、voyage-4-lite、voyage-4-large、voyage-3.5、voyage-3.5-lite、voyage-3-large、voyage-code-3、voyage-multimodal-3、voyage-finance-2、voyage-law-2、またはvoyage-code-2。 -
入力テキストの型。このパラメーターを使用して、セマンティック検索および取得タスクの埋め込みを最適化します。
オプション:
null(デフォルト): モデルは、追加のプロンプトなしで入力を数値ベクトルに直接変換します。query: 入力が検索クエリを表す場合に使用します。モデルは、検索用の埋め込みを最適化するために「 サポートドキュメントを検索するためのクエリを表現します 」を先頭に付けます。document: 入力が検索するドキュメントを表す場合に使用します。モデルは、検索用の埋め込みを最適化するために「Representation for ドキュメント 」を先頭に付けます。
セマンティック検索と取得のタスクでは、常にこのパラメータを
queryまたはdocumentに必要に応じて設定します。input_type引数の有無にかかわらず生成された埋め込みは互換性があります。値は
query、document、または null です。 -
コンテキストの長さを超える入力テキストを切り捨てるかどうか。
true(デフォルト): コンテキストの長さを超える入力テキストは、ベクトル化の前に自動的に切り捨てられます。false: 入力テキストがコンテキストの長さを超えると、エラーが返されます。
デフォルト値は
trueです。 -
出力埋め込みの次元数。
ほとんどのモデルは、単一のデフォルトの単位のみをサポートします。
voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite、voyage-code-3のモデルは、次の値をサポートしています。256、512、1024(デフォルト)、と 2048。モデルのデフォルトの単位を使用するには、
nullに設定します。値は、
256、512、1024、2048、またはnullです。 -
返される埋め込みのデータ型。
オプション:
float(デフォルト): 32 ビットの単精度浮動小数点数。最高の精度と検索精度を提供します。すべてのモデルでサポートされています。int8: -128 から 127 の範囲の 8 ビット符号付き整数。voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite、voyage-code-3でサポートされています。uint8: 0 から 255 の範囲の 8 ビット符号なし整数。voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite、voyage-code-3でサポートされています。binary: ビット圧縮、量子化された単一ビット埋め込み値はint8と表されます。返されるリストの長さは、output_dimensionの 1/8 です。オフセット バイナリ メソッドを使用します。voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite、voyage-code-3でサポートされています。ubinary: ビット圧縮、量子化された単一ビット埋め込み値はuint8と表されます。返されるリストの長さは、output_dimensionの 1/8 です。voyage-4-large、voyage-4、voyage-4-lite、voyage-3-large、voyage-3.5、voyage-3.5-lite、voyage-code-3でサポートされています。
値は、
float、int8、uint8、binary、またはubinaryです。デフォルト値はfloatです。 -
応答内の埋め込みがエンコードされる形式。
オプション:
null(デフォルト): 埋め込みは配列として返されます。output_dtypeがfloatの場合、各埋め込みは浮動小数点数の配列になります。その他のoutput_dtype値(int8、uint8、binary、ubinary)の場合、各埋め込みは整数の配列です。base64: 埋め込みは、次のデータ型を持つ base64 でエンコードされた NumPy 配列として返されます。numpy.float32output_dtypeがfloatの場合numpy.int8output_dtypeがint8またはbinaryの場合numpy.uint8output_dtypeがuint8またはubinaryの場合
値は
base64または null です。
curl \
--request POST 'https://ai.mongodb.com/v1/embeddings' \
--header "Authorization: Bearer $ACCESS_TOKEN" \
--header "Content-Type: application/json" \
--data '{"input":"string","model":"voyage-context-3","input_type":"query","truncation":true,"output_dimension":256,"output_dtype":"float","encoding_format":"base64"}'
{
"input": "string",
"model": "voyage-context-3",
"input_type": "query",
"truncation": true,
"output_dimension": 256,
"output_dtype": "float",
"encoding_format": "base64"
}
{
"object": "list",
"data": [
{
"object": "embedding",
"embedding": [
42.0
],
"index": 42
}
],
"model": "string",
"usage": {
"total_tokens": 42
}
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}
{
"detail": "string"
}