1 つのクラスターのすべてのユーザー定義アナライザを返す
指定されたクラスターが指定されたプロジェクトで使用するすべての Atlas Search カスタムアナライザを返します。カスタムアナライザは、フィールドをインデックスために実行する操作を定義します。このリソースを使用するには、リクエスト元の サービス アカウント またはAPIキーにプロジェクトのデータアクセスに関する読み取りおよび書込みロールが必要です。
path パラメータ
-
プロジェクトを識別する一意の 24 桁の 16 進数文字列。 認証済みユーザーがアクセスできるすべてのプロジェクトを取得するには、 /groups エンドポイントを使用します。
注: グループとプロジェクトは同義語です。そのため、グループ ID はプロジェクト ID と同じです。既存のグループの場合、グループ/プロジェクト ID は同じままです。リソースおよび対応するエンドポイントでは、グループという用語が使用されます。
形式は次のパターンと一致する必要があります:
^([a-f0-9]{24})$。 -
1 つ以上の Atlas Search インデックスを持つコレクションを含むクラスターの名前。
形式は次のパターンと一致する必要があります:
^[a-zA-Z0-9][a-zA-Z0-9-]*$。
クエリ パラメータ
-
アプリケーションがレスポンスを
envelopeJSON オブジェクトにラップするかどうかを示すフラグ。一部の API クライアントは、HTTP レスポンス ヘッダーまたはステータス コードにアクセスできません。これを修正するには、クエリで envelope=true を設定します。結果のリストを返すエンドポイントは、結果オブジェクトをエンベロープとして使用します。アプリケーションは、レスポンス本体にステータス パラメータを追加します。デフォルト値は
falseです。 -
レスポンス本体を pretty-print 形式にするかどうかを示すフラグ。
デフォルト値は
falseです。Prettyprint
応答
-
OK
応答属性の非表示 応答属性の表示 オブジェクト
-
テキストを 1 文字ずつ検査し、フィルタリング操作を実行するフィルター。
次の 1 つ: HTML 構造を削除するフィルター。
ICU Normalizer で正規化されたテキストを処理するフィルター。これは、 Lucene の ICUNormazer2CharFilter に基づいています。
ICUNormazer2CharFilter 文字に指定した正規化マッピングを適用するフィルター。
ゼロ幅非結合のインスタンスを通常のスペースに置き換えるフィルター。これは Lucene の PersianCharFilter に基づいています。
PersianCharFilter -
カスタムアナライザを識別する、人間が判読できる名前。 名前はインデックス内で一意である必要があり、次のいずれかの文字列で始まらない必要があります。
lucene.builtin.mongodb.
-
次のような操作を実行するフィルター。
ステミング 。これにより、「toring」、「thaled」、「torages」などの関連単語を語幹単語の「torage」に減らします。
編集 : 公開ドキュメントから機密情報を排除します。
次のいずれか: tokenFilterSCIIBuildingオブジェクトtokenFilterdwitchMokoffStringオブジェクト tokenFilteredgeGramオブジェクト TokenFilterenglishPassiveオブジェクト TokenFilterFlattenGraphオブジェクト tokenFiltericForwardingオブジェクト tokenFiltercuNormalizerオブジェクト TokenFilterkStemming object tokenFilterLengthオブジェクトtokenFilterLowercaseオブジェクト tokenFilterGramオブジェクト TokenFilterPorterStemingオブジェクト tokenFilterregexオブジェクト tokenFilterreverseオブジェクト tokenFilterishleオブジェクト tokenFiltersnowballStringオブジェクト TokenFilterSpanishPluralStemingオブジェクト TokenFilterStempel object tokenFilterストップオブジェクトtokenFiltertrimオブジェクト TokenFilterWiredTigerGraphオブジェクト 基本ラテン Unicode ブロックに含まれていない文字、数字、および記号 Unicode 文字を ASCII に変換するフィルター(使用可能な場合)。
基本ラテン Unicode ブロック Darty-MongoDB Shellex 発音区別アルゴリズムに基づいて、同じように発音する単語のトークンを作成するフィルター。このフィルターは、入力ごとに複数のエンコーディングを生成できます。各エンコードされたトークンは 6 桁の数字です。
注意 : 次の場合は、daitchMotor保存オプションを使用しないでください。
-シノニム(同意語)またはオートコンプリート マッピング定義
- ファジーが有効になっている演算子。 Atlas Search は、 オートコンプリート 、ターム、および テキスト 演算子に対してのみ ファジー オプションをサポートしています。
デーモン] テキスト入力の左側、つまり「エッジ」からの入力を設定されたサイズの n グラムにトークン化するフィルター。このトークン フィルターは、シノニム(同意語)またはオートコンプリートのマッピング定義では使用できません。
属性を非表示 属性を表示
-
生成された n グラムの最大長を指定する値。この値は minGram 以上である必要があります。
-
生成された n グラムの最小長を指定する値。この値は maxGram 未満である必要があります。
-
minGram より短いトークンまたは maxGram より長いトークンのインデックスするかどうかを示す値。
値は
omitまたはincludeです。デフォルト値はomitです。 -
このトークン フィルター タイプを識別する、人間が判読できるラベル。
値は
edgeGramです。
単語から所有語(後続の )を削除するフィルター。
トークン フィルターグラフ(wordDelimiterGraph トークン フィルターが生成するトークン フィルターグラフなど)をインデックス作成に適した平面形式に変換するフィルター。
Unicode テクニカル レポート #30 からの文字フォールディングを適用するフィルター。
Unicode テクニカル レポート #30 標準の Unicode 正規化モードを使用してトークンを正規化するフィルター。
Unicode 正規化モード 言語のステミングと組み込み辞書を組み合わせたフィルターで、単語のステミングを行います。
小さすぎるまたは長すぎるトークンを削除するフィルター。
トークン テキストを小文字に正規化するフィルター。
入力を設定されたサイズの n グラムにトークン化するフィルター。このトークン フィルターは、シノニム(同意語)またはオートコンプリートのマッピング定義では使用できません。
属性を非表示 属性を表示
-
生成された n グラムの最大長を指定する値。この値は minGram 以上である必要があります。
-
生成された n グラムの最小長を指定する値。この値は maxGram 未満である必要があります。
-
minGram より短いトークンまたは maxGram より長いトークンのインデックスするかどうかを示す値。
値は
omitまたはincludeです。デフォルト値はomitです。 -
このトークン フィルター タイプを識別する、人間が判読できるラベル。
値は
nGramです。
ポータル ステミングアルゴリズムを使用して、英語の単語から一般的な語形接尾辞、または語幹を読む フィルター 。これは小文字のテキストを要求し、大文字のテキストの場合は期待どおりに動作しません。
各トークンに正規式を適用し、指定された文字列に一致するフィルター。
一連のトークンからラップリング(トークン n グラム)を構築するフィルター。このトークン フィルターは、シノニム(同意語)またはオートコンプリートのマッピング定義では使用できません。
SNMP で生成されたステマーを使用してトークンをステミングするフィルター。
スキーレーターで生成されたステマー 属性を非表示 属性を表示
-
使用するスキーマが生成されたステマー。
値は
arabic、armenian、basque、catalan、danish、dutch、english、finnish、french、german、german2、hungarian、irish、italian、kp、lithuanian、lovins、norwegian、porter、portuguese、romanian、russian、spanish、swedish、またはturkish。 -
このトークン フィルター タイプを識別する、人間が判読できるラベル。
値は
snowballStemmingです。
スペイン語の複数形の単語を語幹するフィルター。小文字のテキストが必要です。
Lucene のデフォルトのポーランド語ステマー テーブルを使用して、ポーランド言語の単語の語幹をサポートするフィルター。小文字のテキストが必要です。
デフォルトのポーランド語ステマー テーブル 指定されたストップワードに対応するトークンを削除するフィルター。このトークン フィルターは、指定されたストップワードは分析しません。
設定されたルールに基づいてトークンをサブトークンに分割するフィルター。
属性を非表示 属性を表示
-
単語をサブ単語に分割する方法を決定するルールを含むオブジェクト。
deleteOptions 属性を非表示 deleteOptions 属性を表示 オブジェクト
-
の実行を連結するかどうかを示すフラグ。
デフォルト値は
falseです。 -
サブ番号の実行を連結するかどうかを示すフラグ。
デフォルト値は
falseです。 -
サブワードの実行を連結するかどうかを示すフラグ。
デフォルト値は
falseです。 -
サブ番号に基づいてトークンを分割するかどうかを示すフラグ。 たとえば、
trueの場合、このオプションは100-2を100と2に分割します。デフォルト値は
trueです。 -
サブワードに基づいてトークンを分裂かどうかを示すフラグ。
デフォルト値は
trueです。 -
keyword属性がtrueに設定されているトークンをスキップするかどうかを示すフラグ。デフォルト値は
falseです。 -
元の単語のトークンを生成するかどうかを示すフラグ。
デフォルト値は
trueです。 -
大文字と小文字の移行に基づいてトークンを分裂かどうかを示すフラグ。
デフォルト値は
trueです。 -
文字数トランザクションに基づいてトークンを分裂かどうかを示すフラグ。
デフォルト値は
trueです。 -
各サブワードから後続の所有者を削除するかどうかを示すフラグ。
デフォルト値は
trueです。
-
-
保護された単語のオプションを含むオブジェクト。
-
このトークン フィルター タイプを識別する、人間が判読できるラベル。
値は
wordDelimiterGraphです。
トークナイザ
オブジェクト 必須 トークンを作成するために使用する トークナイザ 。 トークンは、Atlas Search がインデックスを作成するためにテキストを個別のチャンクに分割する方法を決定します。
次の 1 つ: テキスト入力の左側、つまり「エッジ」から入力を指定されたサイズの n グラムに分割するトークナイザ。シノニム(同意語) または オートコンプリート のマッピング定義では、edgeGramトークナイザを使用できません。
入力全体を単一のトークンとして結合するトークナイザ。
入力を指定されたサイズのテキスト チャンク、つまり「n グラム」に分割するトークナイザ。シノニム(同意語) または オートコンプリート マッピング定義では nGramトークナイザは使用できません。
正規式パターンを使用してトークンを抽出する トークナイザ 。
正規表現ベースの区切り文字を使用してトークンを分割するトークナイザ。
Unicode テキスト分割アルゴリズムからの単語の分割ルールに基づいてトークンを分割するトークナイザ。
Unicode テキスト分割アルゴリズム URL とメールアドレスからトークンを作成するトークナイザ。このトークナイザはUnicode テキスト分割アルゴリズムの単語の分割ルールを使用しますが、インデックスされたフィールド値に URL とメールアドレスが含まれている場合にのみ使用することをお勧めします。 URL またはメールアドレスを含まないフィールドの場合は、標準のトークナイザを使用してワードブレークルールに基づいてトークンを作成します。
Unicode テキスト分割アルゴリズム
-
-
見つかりません。
応答属性の非表示 応答属性の表示 オブジェクト
-
無効なリクエストの詳細。
-
各タイプのエラーの原因となる特定の条件または理由について説明します。
-
このエラーで返された HTTP ステータス コード。
外部ドキュメント -
このエラーで返されたアプリケーション エラー コード。
-
エラーに関する詳細情報を提供するために使用されるパラメーター。
-
このエラーで返されたアプリケーション エラー メッセージ。
-
-
内部サーバーエラー。
応答属性の非表示 応答属性の表示 オブジェクト
-
無効なリクエストの詳細。
-
各タイプのエラーの原因となる特定の条件または理由について説明します。
-
このエラーで返された HTTP ステータス コード。
外部ドキュメント -
このエラーで返されたアプリケーション エラー コード。
-
エラーに関する詳細情報を提供するために使用されるパラメーター。
-
このエラーで返されたアプリケーション エラー メッセージ。
-
curl \
--request GET 'https://cloud.mongodb.com/api/atlas/v1.0/groups/32b6e34b3d91647abb20e7b8/clusters/{clusterName}/fts/analyzers' \
--header "Authorization: Bearer $ACCESS_TOKEN"
[
{
"charFilters": [
{
"ignoredTags": [
"string"
],
"type": "htmlStrip"
}
],
"name": "string",
"tokenFilters": [
{
"originalTokens": "omit",
"type": "asciiFolding"
}
],
"tokenizer": {
"maxGram": 42,
"minGram": 42,
"type": "edgeGram"
}
}
]
{
"error": 404,
"detail": "(This is just an example, the exception may not be related to this endpoint) Cannot find resource AWS",
"reason": "Not Found",
"errorCode": "RESOURCE_NOT_FOUND"
}
{
"error": 500,
"detail": "(This is just an example, the exception may not be related to this endpoint)",
"reason": "Internal Server Error",
"errorCode": "UNEXPECTED_ERROR"
}