문서 메뉴

문서 홈MongoDB 실행 및 관리MongoDB Atlas

공백 분석기

whitespace 분석기는 공백 문자를 찾을 때마다 텍스트를 검색 가능한 용어(토큰)로 나눕니다. 모든 텍스트는 원래 대소문자를 그대로 유지합니다.

중요

Atlas Search는 크기가 32766바이트를 초과하는 문자열 필드를 인덱싱하지 않습니다.

다음 예제 인덱스 정의는 whitespace 분석기를 사용하여 sample_mflix.movies 컬렉션의 title 필드에 대한 인덱스를 지정합니다. 클러스터에 컬렉션을 로드한 경우, Atlas UI 비주얼 편집기 또는 JSON 편집기를 사용하여 예제 인덱스를 만들 수 있습니다. 원하는 구성 방법을 선택한 후 데이터베이스와 컬렉션을 선택하세요.

다음 쿼리는 title 필드에서 Lion's 이라는 용어를 검색합니다.

db.movies.aggregate([
{
"$search": {
"text": {
"query": "Lion's",
"path": "title"
}
}
},
{
"$project": {
"_id": 0,
"title": 1
}
}
])
[
{ title: 'Lion's Den' },
{ title: 'The Lion's Mouth Opens' }
]

Atlas Search는 lucene.whitespace 분석기를 사용하여 title 필드의 텍스트에 대해 다음을 수행하여 이러한 문서를 반환합니다.

  • 텍스트의 원래 대소문자를 유지합니다.

  • 공백 문자를 찾을 때마다 텍스트를 토큰으로 나눕니다.

다음 표는 Atlas Search가 공백 분석기단순 분석기키워드 분석기 를 사용하여 결과의 문서에 대해 생성하는 토큰(검색 가능한 용어)을 보여줍니다.

제목
공백 분석기 토큰
간단한 분석기 토큰
키워드 분석기 토큰
Lion's Den
Lion's, Den
lion, s, den
Lion's Den
The Lion's Mouth Opens
The, Lion's, Mouth, Opens
the, lion, s, mouth, opens
The Lion's Mouth Opens

whitespace 분석기를 사용하는 인덱스는 대소문자를 구분합니다. 따라서 Atlas Search는 쿼리 용어 Lion'swhitespace 분석기에서 생성된 토큰 Lion's 과 일치시킬 수 있습니다.

← 단순 분석기