/ /

MongoDB Search インデックスでのシノニムマッピングの定義

MongoDB Searchインデックス定義の synonyms オプションは、コレクション内で同じ意味またはほぼ同じ意味を持つ単語をインデックスて検索できるシノニムマッピングを指定します。シノニム（同意語）マッピングを使用してMongoDB Searchインデックスを構成するには、次の手順を実行する必要があります。

クラスターにシノニムドキュメントのコレクションを追加します。以下を確認してください。
- コレクションは、参照先となるインデックスと同じデータベース内にあります。
- ドキュメントは適切にフォーマットされています
インデックス定義内のシノニム（同意語）マッピングでシノニムソースコレクションを参照します。

シノニム（同意語）マッピングにより、インデックスの作成を行うコレクションと同じデータベース内のシノニム（同意語）ソースコレクションからシノニムを適用するクエリをサポートするようにMongoDB検索インデックスが構成されます。シノニム（同意語）は、テキストまたはフレーズ演算子を使用するクエリでのみ使用できます。

注意

無料（M0）階層クラスターの制限

インデックス定義には、シノニムマッピングを 1 つだけ含めることができます。

このページでは、シノニム（同意語）ソースコレクションの形式と、 MongoDB Searchインデックスのシノニムソースコレクションを参照シノニムマッピングを定義する方法について説明します。

構文

synonyms のインデックス定義の構文は次のとおりです。

構文

1 { 
2   "synonyms": [
3     {
4       "name": "<synonym-mapping-name>",
5       "source": {
6         "collection": "<source-collection-name>"
7       },
8       "analyzer": "<synonym-mapping-analyzer>"
9     }
10   ] 
11 }

オプション

synonyms は、インデックス定義で次のフィールドを取ります。

フィールド	タイプ	説明	必要性
`analyzer`	string	このシノニムマッピングで使用するアナライザの名前。シノニムマッピングを使用すると、同じアナライザで分析されたフィールドのみをクエリすることができます。ストップワードを含むシノニムを使用するには、標準アナライザを使用してフィールドをインデックス化するか、ストップワードを含まずにシノニムエントリを追加する必要があります。以下を除く任意のMongoDB Searchアナライザを使用できます。言語アナライザ: `lucene.kuromoji` `lucene.cjk` カスタムアナライザトークナイザとトークンフィルター: nGram トークナイザ EdgeGram Tokenizer datchMotor fsDocumentフィルター nGramトークンフィルター EdgeGramトークンフィルター単一トークンフィルター passwordDelimiterGraphトークンフィルター	必須
`name`	string	シノニム（同意語）マッピングの名前。名前は、インデックス定義内で一意である必要があります。値は空のstringにできません。	必須
`source`	ドキュメント	シノニム（同意語）のソースコレクション。 `source`オプションは`collection`フィールドを取ります。	必須
`source.collection`	string	MongoDB Search インデックスと同じデータベース内にある MongoDB コレクションの名前。このコレクションのドキュメントは、シノニムソースコレクションのドキュメントで説明されている形式である必要があります。	必須

シノニムソースコレクションドキュメント

シノニム（同意語）のソースとして指定されるコレクション内の各ドキュメントは、1 つ以上の単語がその単語の 1 つ以上のシノニム（同意語）にマップする方法を示します。

注意

無料階層クラスターでは、シノニムコレクションは10,000 ドキュメントを超えることはできません。

シノニムソースコレクションドキュメントの形式

各ドキュメントは、次のフィールドで構成する必要があります。

フィールド	タイプ	説明	必要性
`input`	文字列の配列	`mappingType: explicit`マッピングに必要です。 `explicit`マッピングの場合、 `synonyms`値は各`input`トークンのシノニム（同意語）です。値は、空またはすべて空白のstringにすることはできません。複数のドキュメントで同じ`input`値を指定できます。	条件付き
`mappingType`	string	マッピングのタイプ。値は次のいずれかになります。 `equivalent` - 互いに同等のトークンのセットを記述します。この`mappingType`の例については、「例」を参照してください。 `explicit` - は`input`トークンと一致し、それらをすべての代替としての`synonyms`トークンに置き換えます。この`mappingType`の例については、「例」を参照してください。	必須
`synonyms`	文字列の配列	`mappingType`が`equivalent`の場合は相互のシノニム（同意語）である単語、または`mappingType`が`explicit`の場合は`input`トークンのシノニム（同意語）。 `synonyms`には少なくとも 1 つの値が必要です。ストップワードを含むシノニムを使用するには、ストップワードを含まずにシノニムを追加するか、標準アナライザを使用してフィールドにインデックスを付ける必要があります。各`mappingType`の例については、「ソースコレクションドキュメントの例」を参照してください。	必須

コレクション内のドキュメントには他のフィールドを含めることができます。コレクション内のドキュメントは追加的であり、マッピングは重複を排除します。MongoDB Search シノニム（同意語）は別の Atlasコレクションとして保存され、Atlas の他のコレクションと同じストレージ割り当てに対してカウントされます。MongoDB Search は、大きなシノニムソースコレクションからシノニムを適用するために、より多くのコンピューティングリソースを使用する場合があります。

警告

シノニム（同意語）ソースコレクションに無効なシノニムドキュメントを含めないでください。MongoDB Search では、インデックスが無効なドキュメントを含むコレクションを参照シノニムマッピングを使用する場合、インデックスは作成されません。シノニム（同意語）ソースコレクションには、適切にフォーマットされたシノニムドキュメントのみを含めます。

MongoDB では、テスト環境で適切にフォーマットされ、期待どおりに動作することを検証することなく、本番環境のシノニムソースコレクションにシノニムドキュメントを追加することは推奨されません。

シノニムソースコレクションのドキュメントに対する変更

シノニム（同意語）ソースコレクションに変更を加える場合、

MongoDB Search は変更を監視し、内部のシノニムマップを自動的に更新するため、インデックスを再作成する必要はありません。
MongoDB Search がシノニムマッピングを更新するのにかかる時間は、シノニムソースコレクションのサイズに応じて増加します。シノニムドキュメントへの変更は最終的にMongoDB Search クエリ結果に反映されることに注意してください。

コレクションドキュメントの例

ソースコレクションドキュメントの例

Atlas は、sample_synonyms という名前のコレクションに次のMongoDB Searchマッピング型の例のドキュメントを提供します。これらのドキュメントは、コレクションと同じデータベース内のクラスターにロードできます。コレクションのインデックスを作成するときに、これらのドキュメントをクラスターにロードするには、次の手順を実行します。

Configuration Methodを選択した場合、 Visual Editorを選択します。
インデックスをAdd synonym mappingするときは、 Synonym source collectionドロップダウンからLoad sample collectionを選択します。

`equivalent` `mappingType`

次の例のソースコレクションドキュメントでは、mappingType が equivalent に設定されており、car、vehicle、automobile の各トークンが互いに同義語として構成されています。

{
  "mappingType": "equivalent",
  "synonyms": ["car", "vehicle", "automobile"]
}

このようなドキュメントを含むシノニムマッピングを適用すると、car、vehicle、または automobile のテキストクエリでは、 MongoDB Search は car、vehicle、または automobile というタームを含むドキュメントを返します。

`explicit` `mappingType`

次の例のソースコレクションドキュメントでは、mappingType が explicit に設定されており、beer、brew、pint が input トークン beer の同義語として構成されています。

{
  "mappingType": "explicit",
  "input": ["beer"],
  "synonyms": ["beer", "brew", "pint"]
}

このようなドキュメントを含むシノニムマッピングを適用する beer のテキストクエリでは、 MongoDB Search は「beer」、「brew」、または「pint」というタームを含むドキュメントを返します。これは、input トークン beer が明示的にマッピングされているためです。これらのすべての synonyms トークンに適用されます。ただし、pint のクエリでは、 MongoDB Search は beer を含むドキュメントを見つけられません。pint は beer に明示的にマップされていないためです。

シノニムソースコレクションの例

次の synonymous_terms というコレクションは、sample_mflix データベースの movies コレクションで使用できるシノニムソースコレクションの例です。

sample_mflix.synonymous_terms コレクションには次のドキュメントが含まれます。

{
  "mappingType": "equivalent",
  "synonyms": ["car", "vehicle", "automobile"]
}

{
  "mappingType": "explicit",
  "input": ["race"],
  "synonyms": ["contest", "rally"]
}

{
  "mappingType": "equivalent",
  "synonyms": ["dress", "apparel", "attire"]
}

{
  "mappingType": "explicit",
  "input": ["boat"],
  "synonyms": ["vessel", "sail"]
}

インデックス定義の例

配置タイプ

インターフェース

戻る

storedSource

インデックスパーティション

1	{
2	"synonyms": [
3	{
4	"name": "<synonym-mapping-name>",
5	"source": {
6	"collection": "<source-collection-name>"
7	},
8	"analyzer": "<synonym-mapping-analyzer>"
9	}
10	]
11	}

MongoDB Search インデックスでのシノニム マッピングの定義

注意

無料（M0）階層クラスターの制限

構文

オプション

シノニム ソース コレクション ドキュメント

注意

シノニム ソース コレクション ドキュメントの形式

警告