Docs Menu
Docs Home
/ /

vectorSearch (MongoDB Search 연산자)

vectorSearch 연산자 지정된 필드 의 벡터 임베딩에 대해ANN 또는 ENN 검색 수행합니다. 이 연산자 사용하여 퍼지 검색, 구문 일치, 위치 필터링, 와일드카드 패턴 일치 등과 같은 분석된 텍스트 기능을 시맨틱 검색 과 함께 추가할 수 있습니다.

vectorSearch 의 구문은 다음과 같습니다:

{
"$search": {
"index": "<index name>", // optional, defaults to "default"
"vectorSearch": {
"exact": true | false,
"filter": {<operator-specification>},
"limit": <number-of-results>,
"numCandidates": <number-of-candidates>,
"path": "<field-to-search>",
"queryVector": [<array-of-numbers>],
"score": {<options>}
}
}
}

vectorSearch 는 다음 필드를 사용하여 쿼리 구성합니다.

필드
유형
필요성
설명

exact

부울

옵션

numCandidates를 생략한 경우 필수 항목입니다.

ENN 또는 ANN 검색을 실행할지 여부를 지정하는 플래그입니다. 값은 다음 중 하나일 수 있습니다.

  • false - ANN 검색 실행 시

  • true - ENN 검색 실행 시

생략하는 경우 기본값은 false입니다.

MongoDB Vector Search는 MongoDB v6.0.11를 실행 클러스터에서 ANN 검색 지원하며, v7.0.2 이상 및 MongoDB v 를 실행 클러스터에서 ENN 검색 6 016.., v7.0.10, v7.3.2, 또는 그 이후 버전.

filter

객체

옵션

메타데이터 또는 특정 검색 기준을 기반으로 문서를 사전 필터링하는 데 사용하는 MongoDB Search 연산자 .

자세한학습 은 사전 필터링을 참조하세요.

limit

Int

필수 사항

결과에 반환할 문서 수(int 유형만 해당)입니다. numCandidates를 지정하는 경우 이 값은 numCandidates 값을 초과할 수 없습니다.

샤딩된 클러스터에서는 $limit 단계 이후에 를 사용하여 결과에 표시되는 문서 수를 제한해야 합니다.$search

numCandidates

Int

옵션

exactfalse이거나 생략된 경우 이 필드는 필수입니다.

검색 중에 사용할 가장 가까운 이웃의 수입니다. 값은 (<=)10000보다 작거나 같아야 합니다. 반환할 문서 수보다 작은 숫자는 지정할 수 없습니다(limit).

정확도를 높이기 위해 반환할 문서 수(limit)보다 최소 20배 더 높은 숫자를 지정하는 것이 좋습니다.

이러한 과다 요청 패턴은 근사 최근접 이웃 검색에서 지연 시간과 재현율을 균형 있게 조절하는 데 권장되는 방법이며, 특정 데이터 세트 크기와 쿼리 요구 사항에 따라 이 매개변수를 조정하는 것이 좋습니다.

path

문자열

필수 사항

검색할 인덱싱된 벡터 유형 필드입니다.

queryVector

정수 또는 부동 소수점 배열

필수 사항

float32 숫자 배열, 하위 유형 float32를 사용하는 BSON BinData 벡터, 또는 하위 유형 int1 또는 int8 유형을 사용하는 BSON BinData 벡터로 쿼리 벡터를 나타냅니다.

하위 binData float32유형이, int8 또는 인 BSON 벡터를 생성하는 방법에 대해 int1 자세히 학습 사전 양자화된 벡터를 수집하는 방법을 참조하세요.

배열 크기는 필드 에numDimensions 대한 인덱스 정의에 지정된 벡터 차원()의 수와 일치해야 합니다.

데이터를 임베드할 때 사용한 것과 동일한 모델을 사용하여 쿼리를 임베드해야 합니다.

벡터 하위 유형이 동일한 한 완전 충실도 벡터를 사용하여 임베딩을 쿼리 할 수 있습니다. 이는 하위 유형이 float32binData 벡터에서만 가능합니다. 다른 하위 유형(int8 또는 int1)을 사용하는 경우 MongoDB Search는 결과나 오류를 반환하지 않습니다.

score

객체

옵션

일치하는 검색 텀 결과에 할당된 점수입니다. 다음 옵션 중 하나를 사용하여 기본 점수를 수정합니다.

  • boost결과 점수에 주어진 숫자를 곱합니다.

  • constant결과 점수를 주어진 숫자로 바꿉니다.

  • function: 주어진 표현식을 사용하여 결과 점수를 대체합니다.

쿼리에서 score 사용에 대한 자세한 내용은 결과에서 문서 채점하기를 참조하십시오.

검색 하려면 vectorSearch 연산자 사용하여 필드를 인덱스 해야 합니다. MongoDB Search 인덱스 정의에서 다음 유형의 필드를 인덱스 할 수 있습니다.

  • 벡터 임베딩을 포함하는 필드입니다. 이는 쿼리 path 옵션에서 지정하는 필드 입니다.

  • 문서를 사전 필터링할 필드입니다. 다음은 쿼리 filter 옵션에서 지정하는 필드입니다.

문서를 사전 필터링하여 시맨틱 검색 범위를 좁히고 모든 벡터가 비교 대상으로 고려되지 않도록 할 수 있습니다. filter 필드 에서 지원되는 MongoDB Search 연산자 사용하여 문서를 쿼리 하고 필터하다 수 있습니다.

유형에 대한 인덱스 정의에서 데이터를 필터하다 하려는 필드를 인덱스 해야 합니다.vector

검색 결과에 각 문서 의 점수를 포함할 searchScore 있습니다.$project 단계에서 값을 사용하여 $meta 표현식 지정합니다.searchScoreDetails 점수에 scoreDetails 대한 자세한 분석을 위해 필드 $meta 표현식 에 값을 지정할 수도 있습니다.

자세히 학습 결과에서 문서에 점수 매기기및 점수 세부 정보 반환하기를 참조하세요.

vectorSearch 연산자 쿼리에서 최상위 연산자 여야 합니다. 따라서 vectorSearch 다음 MongoDB Search 연산자 내에서 연산자 사용할 수 없습니다.

vectorSearch 유형 인덱스 사용하여 인덱싱된 vectorSearch 필드를 쿼리 데 연산자 사용할 수 없습니다.

$search 다음 옵션은 vectorSearch 연산자 와 함께 사용할 수 없습니다.

Search Tester를 사용하여 연산자 $search로 쿼리를 실행 수 없습니다.vectorSearch

다음 예제에서는 sample_mflix.embedded_movies 샘플 데이터의 컬렉션 사용합니다. 샘플 데이터를 로드하고 컬렉션 에 샘플 인덱스 생성하면 쿼리에서 및 자리 표시자를 바꾼 후 <connection-string> <index-name> 컬렉션 에 대해 다음 ANN 및 ENN 쿼리를 실행 수 있습니다.

돌아가기

text

이 페이지의 내용