vector 필드 유형 및 vectorSearch 연산자 미리보기 기능으로 사용할 수 있습니다. 기능 및 해당 설명서는 미리 보기 기간에 언제든지 변경될 수 있습니다. 자세한 학습 은 미리보기 기능을 참조하세요.유형을 사용하여 벡터 임베딩을 인덱스 수 있습니다. 벡터 필드 다음 유형의 vector 숫자 배열 이 포함되어야 합니다.
BSON
int32,int64또는double데이터 유형BSON
double데이터 유형
단계와 유사한 vectorSearch 연산자 집계 파이프라인 $vectorSearch $search 에서 사용하여 vector 유형으로 인덱싱된 필드를 쿼리 할 수 있습니다.
vector 유형 제한 사항
다음과 같은 제한 사항이 적용됩니다:
객체 배열( MongoDB Search
embeddedDocuments유형)이 있는 필드는vector유형으로 인덱스 할 수 없습니다.유형을 포함하는 인덱스 정의에서는 storedSource를 로
truevectorinclude설정하다 수 없습니다. 대신mongotexclude를 사용하여vector에 저장 필드를 지정하거나 를 사용하여 유형의 필드 저장 에서 제외합니다.$vectorSearch단계를 사용하여vector유형으로 인덱싱된 필드를 쿼리 할 수 없습니다.
vector 유형에 대한 인덱스 정의
vector 필드 속성 구성
vector 필드 속성 구성
MongoDB Search vector 유형은 다음 매개 변수를 사용합니다.
옵션 | 유형 | 필요성 | 설명 |
|---|---|---|---|
|
| 필수 사항 | 이 토크나이저 유형을 식별하는 사람이 읽을 수 있는 레이블입니다. 값은 |
| Int | 필수 사항 | MongoDB Search가 인덱스 시점과 쿼리 시점에 시행하는 벡터 차원의 수입니다. 이 필드 양자화된 벡터 또는 BinData를 인덱싱 하려면 다음 값 중 하나를 지정할 수 있습니다.
선택한 임베딩 모델에 따라 벡터 임베딩의 차원 수가 결정되며, 일부 모델에는 출력되는 차원 수에 대한 여러 옵션이 있는 경우도 있습니다. 자세한 학습은 임베딩 생성 방법 선택을 참조하세요. |
| 문자열 | 필수 사항 | 상위 K-최근접 이웃을 검색 데 사용하는 벡터 유사성 함수입니다. 이 필드 다음 값 중 하나를 지정할 수 있습니다.
|
| 문자열 | 옵션 | 벡터에 대한 자동 벡터 양자화 유형입니다. 임베딩이 다음 값 중 하나를 지정할 수 있습니다.
|
| 객체 | 옵션 | Hierarchical Navigable Small Worlds 그래프 구성에 사용할 매개변수입니다. 생략하면 중요: 이 기능은 미리보기 기능 으로 사용할 수 있습니다. 기본값 을 수정하면 MongoDB Search 인덱스 및 쿼리에 부정적인 영향 수 있습니다. |
hnswOptions.maxEdges | Int | 옵션 | Hierarchical Navigable Small Worlds 그래프에서 노드가 가질 수 있는 최대 간선(또는 연결) 수입니다. 값은 숫자가 높을수록 그래프 더 잘 연결되어 있으므로 리콜(검색 결과의 정확도)이 향상됩니다. 그러나 이렇게 하면 그래프 노드 당 평가할 이웃 수가 증가하여 쿼리 및 인덱싱 시간도 늘어나고, Hierarchical Navigable Small Worlds 그래프 에서 각 연결에 대해 추가 노드를 저장 데 더 많은 메모리가 필요합니다. |
hnswOptions.numEdgeCandidates | Int | 옵션 | 쿼리 시 숫자가 클수록 연결이 고품질인 그래프 제공하여 검색 품질(리콜)을 개선할 수 있지만 쿼리 지연 시간 도 증가할 수 있습니다. |
vector 유형에 대한 예시 사용해보기
다음 sample_mflix.embedded_movies 인덱스 정의 예시 샘플 데이터에서 컬렉션 사용합니다.컬렉션 로드한 후 다음 예시 plot_embedding_voyage_3_large vector vectorSearch 사용하여( MongoDB Search 연산자)를 사용하여 쿼리를 실행 위해 필드 를 유형으로 인덱스 할 수 있습니다. 이 인덱스 에 대해 실행 샘플 쿼리 는 예제를 참조하세요.
이 인덱스 정의는 기본값 를 사용하여 동적으로 인덱싱할 수 있는 모든 필드를 typeSet 자동으로 plot_embedding_voyage_3_large 인덱싱하고 vector 다음 설정을 사용하여 필드 유형으로 인덱싱합니다.
2048차원 수dotProduct유사성 함수scalar양자화