쿼리 및 인덱스

검색 쿼리와 검색 인덱스 간의 관계 MongoDB Search를 사용하여 MongoDB 컬렉션 내에서 데이터를 얼마나 효율적이고 효과적으로 찾을 수 있는지를 나타냅니다.

MongoDB Search 쿼리는 데이터베이스 내에서 문서를 찾기 위한 기준을 지정합니다. MongoDB Search 쿼리는 또는 $search $searchMeta 파이프라인 단계로 시작하는 집계 파이프라인 의 형태를 취합니다. 파이프라인 단계 내에서 연산자, 수집기 및 검색 옵션을 사용하여 전체 텍스트 검색, 관련성 기반 순위, 패싯 검색 , 필터링 및 정렬과 같은 복잡한 검색 기능을 구현 수 있습니다.

MongoDB Search 쿼리 실행 하려면 먼저 검색 하려는 필드에 MongoDB Search 인덱스 만들어야 합니다. 검색 인덱스는 쿼리 의 검색 기준을 충족하는 문서를 빠르게 조회 최적화된 데이터 구조입니다. 검색 인덱스 정의할 때 인덱스 할 필드와 이러한 필드를 토큰화하는 방법을 지정합니다.

효과적인 검색 쿼리는 적절하게 정의된 검색 인덱스에 달려 있습니다. 검색하려는 필드는 인덱싱되어야 하며, 인덱스 구성에 따라 검색이 정렬, 패싯, 자동 완성 및 기타 검색 기능을 지원하는지 여부가 결정됩니다. 쿼리와 인덱스 설계를 반복적으로 조정하여 검색 정확도와 성능 간의 균형을 맞출 수 있습니다.

이 페이지에서는 MongoDB Search 검색 환경을 계획하고 검색 요구 사항에 맞게 MongoDB Search 인덱스 및 쿼리 정의하는 방법을 설명합니다.

검색 경험 계획하기

MongoDB Search 구현 계획할 때는 먼저 제공하려는 검색 환경을 정의하세요.

애플리케이션이 수행해야 하는 검색 유형을 명확하게 식별하세요. 블로그 웹사이트에서 글 제목에 대한 전체 텍스트 검색 및 자동 완성 기능을 구축 중이신가요, 아니면 제품 카테고리별 패싯 검색 및 필터링이 필요한 전자상거래 사이트를 위한 검색 기능을 구축 중이신가요?
사용자가 애플리케이션 과 상호 작용 방식을 결정합니다. 빠른 응답 시간이나 정확한 자동 완성 제안과 같이 사용자 경험을 향상시킬 기능의 우선 순위를 지정하세요.

그런 다음, 이러한 사용자 요구 사항에 따라 MongoDB Search 인덱스 및 쿼리의 구조를 결정하는 데 도움이 되는 다음 질문을 고려하세요.

사용자들은 무엇을 검색하고 있나요?

문서 콘텐츠 또는 검색 메타데이터를 반환할지 선택하세요.

애플리케이션 사용자가 문서의 내용이나 문서에 대한 메타데이터 반환할지 여부를 고려하세요.

사용자가 문서 콘텐츠를 원하면 $search 집계 단계를 사용하여 검색 기준에 맞는 문서를 반환하세요.
사용자가 검색 결과에 대한 메타데이터를 원하면 $searchMeta 단계를 사용하여 일치하는 문서 및 패싯의 사용자 지정 가능한 개수를 반환하세요.

문서의 어떤 필드에 검색 용어가 포함될 가능성이 높나요?

사용자가 찾고자 하는 데이터를 포함하는 필드를 기준으로 인덱스할 필드를 결정하세요.

컬렉션 내에서 사용자가 검색 할 가능성이 높은 특정 필드를 식별하여 인덱스 할 필드를 파악할 수 있습니다. 각 MongoDB Search 쿼리 컬렉션 내의 하나 이상의 지정된 필드에서 추출한 용어가 포함된 단일 MongoDB Search 인덱스 검색합니다. MongoDB Search 쿼리를 계획할 때 정적 또는 동적 매핑을 활성화하여 키 필드만 인덱싱할지 아니면 지정된 컬렉션의 모든 필드 인덱스 할지 결정합니다. 쿼리 경로 를 필드 배열로 지정하거나 queryString 연산자 사용하여 여러 필드에 걸쳐 쿼리 할 수 있습니다.

사용자의 검색 용어가 데이터와 얼마나 일치해야 하나요?

사용자의 일반적인 검색 용어가 데이터와 정확히 일치하는지, 유사한지, 부분적으로 일치하는지에 따라 검색 연산자를 선택하세요.

사용자의 일반적인 검색 는 클러스터 의 데이터와 정확히 일치하거나, 유사하거나, 부분적으로 일치할 수 있습니다. 예시를 들어, 영화 검토 애플리케이션 사용자는 정확한 연도의 영화를 필터하다 하거나 자신이 좋아하는 영화와 유사한 영화 추천을 볼 수 있습니다.

사용자가 검색하는 일치 항목 유형을 결정하여 MongoDB Search 쿼리에 사용할 연산자 를 알립니다.

정확히 일치하는 경우, equals 또는 in과 같은 연산자를 사용하여 지정된 query 값과 동일한 용어가 포함된 문서를 찾습니다. 텍스트 연산자를 사용하여 query 값에 any 또는 all 문자열이 포함된 문서를 일치시킬 수도 있습니다.
유사 일치를 위해 near, moreLikeThis 또는 phrase와 같은 연산자를 사용하여 숫자 값, 문서 또는 지정된 검색 용어와 유사한 문자열 순서를 포함하는 문서를 일치시킵니다. 범위 연산자를 사용하여 지정된 범위 내의 값을 포함하는 문서를 일치시킬 수 있습니다.
실시간 검색 쿼리와 같은 부분 일치의 경우 autocomplete, regex 또는 wildcard 와 같은 연산자를 사용하여 실시간 검색 기능을 구현 정규 표현식을 사용하여 용어를 일치시킵니다.
복합 연산자를 사용하여 여러 일치 동작을 단일 쿼리에 결합할 수 있습니다.

고급 텍스트 분석이 필요하신가요?

애플리케이션에 텍스트 정규화, 다국어 지원 또는 기타 기능이 필요한 경우 텍스트 분석 도구를 사용하세요.

텍스트 정규화, 다국어 지원, 형태소 분석 등이 필요한 애플리케이션의 경우 MongoDB Search 텍스트 분석 도구를 활용하세요.

텍스트 데이터의 언어와 특성에 맞추기 위해 인덱스 정의에서 내장 분석기를 선택하세요. 분석기는 텍스트를 용어 또는 토큰으로 분할하고, 문장 부호와 대문자를 제거하며, 단어를 어근 형태로 변환하는 등 텍스트를 조정할 수 있습니다.
애플리케이션 도메인별 전문 용어 처리 또는 이메일 주소 또는 대시로 구분된 ID와 같은 형식의 텍스트 구문 분석과 같은 특정 요구 사항이 있는 경우 사용자 지정 분석기 를 구성합니다. 사용자 지정 분석기를 활성화 문자별로 텍스트를 필터하다 하거나, 각 토큰 청크 에 포함할 문자 수를 정의하거나, 형태소 분석 또는 편집을 활성화 .
유의어를 정의하여 동일하거나 유사한 의미를 가진 용어의 검색 정확도를 향상시키세요.

검색 결과를 어떻게 표시하고 싶으신가요?

검색 옵션을 사용하여 검색 결과에 대한 필터링, 정렬 또는 관련성 요구를 구현 .

사용자의 필터, 정렬 또는 관련성 요구에 따라 검색 결과의 표시 방식을 조정할 수 있습니다.

점수 쿼리 옵션을 사용하여 문서의 관련성 점수를 수정하고 사용자가 결과를 보는 순서에 영향을 줍니다. MongoDB Search 쿼리는 관련성 기반 점수를 결과 설정하다 의 모든 문서 에 연결하고 가장 높은 점수부터 가장 낮은 점수 순으로 문서를 반환합니다.
사용자가 오름차순 또는 내림차순으로 정렬할 가능성이 높은 인덱싱된 필드(예: 날짜 또는 숫자 필드)에 대해 정렬 쿼리 옵션을 설정합니다.
searchBefore 또는 searchAfter 쿼리 옵션을 사용하여 사용자가 순차적으로 탐색하거나 건너뛸 수 있는 페이지 세트로 결과를 표시합니다.
facet (MongoDB Search 연산자) 컬렉터를 사용하여 사용자가 카테고리 또는 기타 차원을 기준으로 결과를 필터하다 할 수 있습니다. 이를 통해 검색 결과의 관련성을 크게 개선하여 사용자에게 보다 안내된 검색 환경을 제공할 수 있습니다.

어떻게 하면 검색 성능을 최적화할 수 있을까요?

검색 성능을 최적화하기 위해 인덱스와 쿼리 구성을 조정하세요.

MongoDB Search 쿼리 성능은 인덱스 구성과 쿼리의 복잡성에 영향을 받습니다. 애플리케이션의 검색 기능에 중요한 인덱싱 필드에 집중하고 쿼리 복잡성과 속도 간의 논리적 균형을 목표로 합니다.

성능을 더욱 최적화하려면 다음 쿼리 옵션을 고려하세요.

동시 쿼리 옵션을 사용하여 쿼리를 평가할 때 실행되는 동시 검색 요청의 수를 설정합니다. 이 옵션은 복잡한 쿼리 또는 대규모 데이터 세트에 유용합니다.
returnStoredSource 쿼리 옵션과 storedSource 인덱스 옵션을 함께 사용하여 인덱스의 일부로 저장된 원본 소스 문서를 검색 결과와 함께 반환할지 여부를 결정합니다. 이 옵션은 검색 기준에 따라 요약 또는 하이라이트를 표시하는 애플리케이션에 유용합니다.
numPartitions 인덱스 옵션을 사용하여 인덱스를 분할하고, 인덱스 객체를 하위 인덱스 간에 최적의 방식으로 분배합니다.

쿼리 성능을 최적화하는 방법에 대한 자세한 권장 사항은 MongoDB Search 쿼리 성능을 참조하세요.

인덱스 정의

MongoDB Search를 사용하여 데이터를 검색 하려면 먼저 MongoDB Search 쿼리 중에 사용할 MongoDB Search 인덱스를 하나 이상 생성해야 합니다. 이 섹션에서는 MongoDB Search 인덱스의 JSON 구성 구문에 쿼리 기본 설정을 적용 방법을 설명합니다.

이 섹션에서 JSON 구문을 인덱스 정의에 사용하려면 자리 표시자를 유효한 값으로 바꾸고 전체 인덱스 정의에 필요한 옵션이 포함되어 있는지확인하세요.

클러스터에 MongoDB Search 인덱스 추가하는 방법을 학습하려면 MongoDB Search 빠른 시작을 참조하세요.

인덱싱할 필드를 선택하세요.

컬렉션에서 쿼리할 필드를 알고 있다면, 정적 매핑을 활성화하고 MongoDB 검색 인덱스 정의에서 필드를 지정하세요. 그렇지 않으면 동적 매핑을 활성화하여 기본값 또는 구성된 필드 유형 세트(typeSet)를 기반으로 모든 필드를 자동으로 인덱스할 수 있습니다.

자세히 학습 동적 및 정적 매핑을 참조하세요.

참고

For more details on MongoDB Search indexes behaviour and limitations, see Considerations for MongoDB Search Indexes.

1 {
2   "mappings": {
3     "dynamic": true
4   }
5 }

1 {
2   "mappings": { 
3     "dynamic": true|false, 
4     "fields": { 
5       "<field-name>": {
6         "type": "<field-type>",
7         ...
8       },
9       ...  
10     }
11   }
12 }

(선택 사항)텍스트 분석 규칙을 적용합니다.

string 데이터에 대한 특별한 언어, 구문 분석 또는 점수 부여 요구 사항이 있는 경우, 다음 옵션을 인덱스 정의에 적용할 수 있습니다.

MongoDB 검색에서 텍스트 필드를 토큰으로 분할하는 방법을 지정하려면 MongoDB 검색 인덱스에 내장 분석기를 설정할 수 있습니다.

1 {
2   "analyzer": "<index-analyzer-name>", // top-level index analyzer, used if no analyzer is set in the field mappings
3   "searchAnalyzer": "<search-analyzer-name>", // query text analyzer, typically the same as the index analyzer
4   "mappings": {
5     "dynamic": <boolean>,
6     "fields":{
7       "<field-name>": [
8         {
9           "type": "string|autocomplete",
10           "analyzer": "<field-analyzer-name>" // field-specific index analyzer
11           "multi": {
12             "<multi-option-name>": {
13               "type": "string|autocomplete",
14               "analyzer": "<alternate-analyzer-name>" // multi-option specific index analyzer
15             }
16           }
17         }
18       ]
19     }
20   }
21 }

MongoDB 검색에서 텍스트를 토큰으로 분할하는 방식을 사용자 정의하려면, MongoDB 검색 인덱스의 analyzers 필드에 사용자 지정 분석기를 정의할 수 있습니다.

1 {
2   "analyzers": [
3     {
4       "name": "<custom-analyzer-name>",
5       "tokenizer": {
6         "type": "<tokenizer-type>"
7       }
8     },
9     ...
10   ]
11 }

동일하거나 유사한 의미를 가진 텀을 고려하는 text 연산자로 쿼리를 실행하려면 MongoDB 검색 인덱스의 synonyms 필드에서 유의어를 정의할 수 있습니다.

1 { 
2   "synonyms": [
3     {
4       "name": "<synonym-mapping-name>",
5       "source": {
6         "collection": "<source-collection-name>"
7       },
8       "analyzer": "<synonym-mapping-analyzer>"
9     }
10   ] 
11 }

MongoDB 검색이 쿼리 중 관련성 점수를 계산할 때 사용하는 유사도 알고리즘을 설정하려면, string 필드에 대해 MongoDB 검색 string 또는 autocomplete 타입으로 인덱싱된 알고리즘을 similarity.type 속성에 지정합니다.

이 옵션은 text, phrase, queryString, autocomplete 연산자가 관련성 점수를 계산하는 방식을 결정합니다. 다양한 유사성 알고리즘에 대해 자세히 알아보려면 점수 세부 정보를 참조하세요.

1   "mappings": {
2     "fields": {
3       "<field-name>": {
4         "type": "string|autocomplete",
5         "similarity": {
6           "type": "bm25|boolean|stableTfl"
7         },
8       },
9       "<field-name>": {
10         "type": "string",
11         "multi": {
12           "<multi-option-name>": {
13             "type": "string",
14             "similarity": {
15               "type": "bm25|boolean|stableTfl"
16             }
17           }
18         }
19       }
20     }
21   }

(선택 사항)쿼리 성능을 최적화하기 위한 옵션을 추가합니다.

대규모 데이터 세트에서 쿼리 성능을 최적화하려면 인덱스 정의에 다음 옵션을 추가하여 MongoDB Search 쿼리 탐색해야 하는 데이터의 양을 제한할 수 있습니다.

numPartitions 옵션을 사용하여 인덱스에 대한 파티션을 구성합니다. 인덱스 분할하면 MongoDB Search는 최적의 방식으로 하위 인덱스 간에 인덱스 객체를 자동으로 배포합니다.

1 {
2   "numPartitions": <integer>,
3 }

storedSource 옵션을 사용하여 MongoDB Search가 저장 해야 하는 소스 문서 의 필드를 지정합니다.

1 {
2   "storedSource": true | false | {
3     "include" | "exclude": [
4       "<field-name>",
5       ...
6     ]
7   }
8 }

쿼리 정의

컬렉션 에서 검색 하려는 모든 필드에 대한 MongoDB Search 인덱스 만든 후 MongoDB Search 쿼리 실행 수 있습니다. 이 섹션에서는 애플리케이션의 검색 경험에 대한 목표 를 MongoDB Search 쿼리의 JSON 구문에 적용 방법을 설명합니다.

MongoDB Search 쿼리 집계 파이프라인 에서 이 섹션의 JSON 구문을 사용하려면 자리 표시자를 유효한 값으로 바꾸고 전체 쿼리 파이프라인 필수 $ 검색 필드 또는 $searchMeta 필드가 포함되어 있는지 확인합니다.

검색 쿼리 실행 방법을 학습하려면 MongoDB Search 빠른 시작을 참조하세요.

초기 MongoDB Search 파이프라인 단계를 선택합니다.

MongoDB Search 쿼리 집계 파이프라인 의 첫 번째 단계는 문서 또는 메타데이터 검색하는지 여부에 따라 $search 또는 $searchMeta 단계여야 합니다.

집계 파이프라인 단계	목적
`$search`	Full Text Search의 검색 결과를 반환합니다.
`$searchMeta`	검색 결과에 대한 메타데이터를 반환합니다.

연산자를 적용하여 검색 기준을 정의합니다.

검색 기준을 정의하려면 연산자 또는 수집기를 $search 또는 $searchMeta 파이프라인 단계에 적용해야 합니다.

MongoDB Search operators allow you to locate and retrieve relevant data from your cluster according to content, format, or data type. To learn which operators support searches for each field type, see the table in the operators reference section. You must specify one or more indexed search fields in the operator's query path parameter:

1 {
2   $search: {
3     "<operator-name>"|"<collector-name>": {
4       <operator-specification>|<collector-specification>
5     }
6   }
7 }

[
  {
    _id: <result-document-id>,
    ...
  },
  {
    _id: <result-document-id>,
    ...
  },
  ...
]

1 {
2   $searchMeta: {
3     "<operator-name>"|"<collector-name>": {
4       <operator-specification>|<collector-specification>
5     }
6   }
7 }

[
  {
    count: {
      total: <results-count>
    }
  }
]

팁

복합 연산자를 사용하여 여러 연산자를 하나의 작업으로 결합할 수 있습니다. 복합 연산자의 필터 절을 사용하여 주어진 절과 일치하는 쿼리 출력을 필터링할 수도 있습니다.

(선택 사항) 옵션 또는 수집기를 적용하여 메타데이터 반환합니다.

MongoDB Search 쿼리 에서 메타데이터 조회 하려면 다음 구성 중 하나를 적용 메타데이터 결과 문서 facet 개수 또는( MongoDB Search 연산자) 유형 중에서 선택할 수 있습니다.

검색 결과의 총 개수 또는 하한 개수를 반환하려면 집계 단계에서 개수 옵션을 설정하다.

$searchMeta 단계는 count 메타데이터 결과를 반환하고, $search 단계는 메타데이터 결과를 $$SEARCH_META 집계 변수 에 저장하고 검색 결과만 반환합니다. $$SEARCH_META 변수에서 count 메타데이터 결과를 조회 방법의 예시는 개수 결과를 참조하세요.

1 {
2   "$search" | "$searchMeta": {
3     "<operator-name>": {
4       <operator-specifications>
5     },
6     "count": {
7       "type": "lowerBound" | "total",
8       "threshold": <number-of-documents> // Optional
9     }
10   }
11 }

값 또는 범위별로 결과를 그룹화하고 이러한 각 그룹의 개수를 반환하는 패싯 쿼리 실행 하려면 집계 단계에서 facet (MongoDB 검색 연산자) 수집기를 사용합니다.

$searchMeta 단계는 facet 메타데이터 결과를 반환하며, $search 단계는 메타데이터 결과를 $$SEARCH_META 집계 변수에 저장하고 검색 결과만 반환합니다. $$SEARCH_META 변수에서 facet 메타데이터 결과를 조회하는 예시는 패싯 결과를 참조하세요.

1 {
2   "$search" | "$searchMeta": {
3     "facet": {
4       "facets": {
5         <facet-definitions>
6       }
7     }
8   }
9 }

(선택 사항) $ 검색 단계에 검색 옵션을 추가하여 MongoDB Search 쿼리 에 대한 추가 정보를 조회.

다음 옵션을 사용하여 $search 단계 결과에 대한 추가 정보를 조회할 수 있습니다.

옵션	사용 사례
하이라이트	텀을 원래의 컨텍스트에 따라 쿼리 결과의 필드로 표시합니다.
점수 상세	MongoDB Search가 반환하는 각 문서 의 점수에 대한 자세한 분석을 조회합니다.
설명합니다.	MongoDB Search가 쿼리 충족하기 위해 실행한 루센 쿼리와 쿼리 다양한 실행 단계에서 소비하는 시간에 대한 분석 조회합니다.

(선택 사항) $ 검색 옵션을 추가하여 결과 순위를 정의합니다.

다음 옵션을 사용하여 $search 결과에 대한 특별 정렬 기능을 구현할 수 있습니다.

옵션	사용 사례
점수	결과에서 문서의 관련성 점수를 수정하여 MongoDB Search가 관련 결과를 반환하도록 합니다.
sort	숫자, 문자열, 날짜 필드 또는 점수별로 결과를 정렬하세요.
searchBefore/searchAfter	정렬된 결과를 중지하거나 시작하기 위한 기준점을 설정하세요.

(선택 사항)$search 옵션을 추가하여 쿼리 성능을 최적화합니다.

다음 $search 옵션을 사용하여 쿼리 성능을 최적화하세요.

옵션	사용 사례
returnStoredSource	컬렉션 에 대한 MongoDB Search 인덱스 정의에 지정된 대로 `mongot` 에 저장된 필드만 검색하여 MongoDB Search 쿼리 보다 효율적으로 실행합니다.
동시	전용 검색 노드에서 여러 세그먼트에 걸쳐 검색을 병렬화하세요.

자세히 알아보기

MongoDB Search 인덱스 및 MongoDB Search 쿼리 빌드 하고 실행 방법을 학습 MongoDB Search 빠른 시작을 참조하세요.

이 튜토리얼에서 언급한 MongoDB Search 쿼리 구성 옵션에 대해 자세히 학습 다음 참조 페이지를 참조하세요.

이 튜토리얼에서 언급한 MongoDB Search 인덱스 구성 옵션에 대해 자세히 학습 다음 참조 페이지를 참조하세요.

돌아가기

패싯

색인 관리

1	{
2	"mappings": {
3	"dynamic": true\|false,
4	"fields": {
5	"<field-name>": {
6	"type": "<field-type>",
7	...
8	},
9	...
10	}
11	}
12	}

1	{
2	"analyzer": "<index-analyzer-name>", // top-level index analyzer, used if no analyzer is set in the field mappings
3	"searchAnalyzer": "<search-analyzer-name>", // query text analyzer, typically the same as the index analyzer
4	"mappings": {
5	"dynamic": <boolean>,
6	"fields":{
7	"<field-name>": [
8	{
9	"type": "string\|autocomplete",
10	"analyzer": "<field-analyzer-name>" // field-specific index analyzer
11	"multi": {
12	"<multi-option-name>": {
13	"type": "string\|autocomplete",
14	"analyzer": "<alternate-analyzer-name>" // multi-option specific index analyzer
15	}
16	}
17	}
18	]
19	}
20	}
21	}

1	{
2	"analyzers": [
3	{
4	"name": "<custom-analyzer-name>",
5	"tokenizer": {
6	"type": "<tokenizer-type>"
7	}
8	},
9	...
10	]
11	}

1	{
2	"synonyms": [
3	{
4	"name": "<synonym-mapping-name>",
5	"source": {
6	"collection": "<source-collection-name>"
7	},
8	"analyzer": "<synonym-mapping-analyzer>"
9	}
10	]
11	}

1	{
2	"storedSource": true \| false \| {
3	"include" \| "exclude": [
4	"<field-name>",
5	...
6	]
7	}
8	}

1	{
2	$search: {
3	"<operator-name>"\|"<collector-name>": {
4	<operator-specification>\|<collector-specification>
5	}
6	}
7	}

1	{
2	$searchMeta: {
3	"<operator-name>"\|"<collector-name>": {
4	<operator-specification>\|<collector-specification>
5	}
6	}
7	}

1	{
2	"$search" \| "$searchMeta": {
3	"<operator-name>": {
4	<operator-specifications>
5	},
6	"count": {
7	"type": "lowerBound" \| "total",
8	"threshold": <number-of-documents> // Optional
9	}
10	}
11	}

1	{
2	"$search" \| "$searchMeta": {
3	"facet": {
4	"facets": {
5	<facet-definitions>
6	}
7	}
8	}
9	}