표준 분석기

standard 분석기 모든 MongoDB Search 인덱스 및 쿼리에 대한 기본값 입니다. 텍스트를 단어 경계에 따라 용어로 나누므로 대부분의 사용 사례에서 언어 중립적입니다. 모든 용어를 소문자로 변환하고 구두점을 제거합니다. 이메일 주소, 약어, 중국어-일본어-한국어 문자, 영숫자 등을 인식하는 문법 기반 토큰화를 제공합니다.

Refine Your Index를 선택하면 Atlas UI Index Configurations 섹션 내에 View text analysis of your selected index configuration 이라는 제목의 섹션이 표시됩니다. 이 섹션을 확장하면 Atlas UI standard 분석기 각 샘플 문자열에 대해 생성하는 인덱스 및 검색 토큰이 표시됩니다. Atlas UI Visual Editor에서 인덱스 생성하거나 편집할 때 standard 분석기 내장 샘플 문서 및 쿼리 문자열에 대해 생성하는 토큰을 볼 수 있습니다.

중요

MongoDB Search는 분석기 토큰 크기가 32766 바이트를 초과하는 문자열 필드를 인덱스 하지 않습니다. 키워드 분석기 사용하는 경우 32766 바이트를 초과하는 문자열 필드는 인덱싱되지 않습니다.

예시

다음 예시 인덱스 정의는 standard 분석기를 사용하여 sample_mflix.movies 컬렉션의 title 필드에 대한 인덱스를 지정합니다. 이 예시를 따라 학습하려면 클러스터에 샘플 데이터를 로드 하고 mongosh 를 사용하거나 MongoDB Search 인덱스 생성 튜토리얼의 단계에 따라 Atlas UI의 Create a Search Index 페이지로 이동하세요.

그런 다음 movies 컬렉션 데이터 소스로 사용하여 예시 절차에 따라 mongosh 또는 Atlas UI Visual Editor 또는 JSON editor에서 인덱스 생성합니다.

➤ 언어 선택 드롭다운 메뉴를 사용하여 이 페이지의 예시에 대한 인터페이스를 설정하다.

인터페이스

다음 쿼리는 title 필드에서 action 용어를 검색하고 출력을 두 개의 결과로 제한합니다.

MongoDB Search는 {MongoDB} action action title lucene.standard 분석기 사용하여 필드 의 텍스트에 대해 다음을 수행하여 생성한 문서의 토큰 에 쿼리 텀 을 일치시켰기 때문에 이러한 문서를 반환했습니다.

텍스트를 소문자로 변환합니다.
단어 경계를 기준으로 텍스트를 분할하고 별도의 토큰을 만듭니다.

다음 표는 MongoDB Search 표준 분석기 를 사용하여 생성하는 토큰(검색 가능한 용어)과 대조적으로 결과의 문서에 대해 키워드 분석기 및 공백 분석기 에 대해 생성하는 토큰을 보여줍니다.

제목	표준 분석기 토큰	키워드 분석기 토큰	공백 분석기 토큰
`Action Jackson`	`action`, `jackson`	`Action Jackson`	`Action`, `Jackson`
`Class Action`	`class`, `action`	`Class Action`	`Class`, `Action`

인덱싱할 때

MongoDB 분석기를 사용하는 경우, 분석기 쿼리텀 필드 action 의 keyword 전체 텀 검색 일치하는 문서(Action Jackson 및 Class Action)를 반환합니다.
공백 분석기를 사용할 경우 MongoDB Search는 whitespace 분석기 title 필드 값을 원래의 대소문자(Action)로 토큰화하고 쿼리 텀 소문자가 소문자이므로 MongoDB Search는 쿼리 텀 action 에 대한 결과의 문서와 일치하지 않습니다. whitespace 분석기 토큰과 일치하지 않는 action입니다.

돌아가기

분석기

simple