Docs Menu
Docs Home
/ /

컬렉션 및 쿼리에서 텍스트 데이터에 대한 벡터 임베딩을 자동으로 생성하는 방법

MongoDB Vector Search 인덱스에 자동으로 임베딩하여 MongoDB Vector Search를 배포 하고 텍스트 데이터에 대한 지능적인 AI 기반 시맨틱 검색 활성화 수 있습니다. MongoDB의 자동화된 임베딩 기능은 기존에 복잡한 벡터 검색 구현 프로세스 단일 단계 솔루션으로 전환합니다. 이제 별도의 임베딩 인프라, 모델 선택, 통합 코드를 관리하는 대신 간단한 필드 구성을 통해 시맨틱 검색 구현 수 있습니다.

MongoDB Vector Search 인덱스를 구성하면 선택한 최신 Voyage AI 임베딩 모델을 사용하여 컬렉션 의 텍스트 데이터에 대한 벡터 임베딩을 자동으로 생성하고, 데이터 변경에 따라 임베딩을 동기화 하며, 다음을 지원합니다. 언어 텍스트 쿼리 사용. 이러한 벡터 임베딩은 데이터에서 의미 있는 관계를 캡처하고 키워드가 아닌 의도를 기반으로 검색할 수 있습니다.

임베딩 코드를 작성하거나, 모델 인프라를 관리하거나, 벡터 파이프라인을 처리하지 않고도 간단한 구성 변경을 통해 시맨틱 검색, RAG 및 AI Agent용 메모리를 활성화 할 수 있습니다. 즉, MongoDB 검색 및 벡터 검색 프로세스 를 사용하여 MongoDB Community Edition 배포할 때 임베딩을 생성하는 데mongot 사용할Voyage AI API 키를 제공할 수 있으며, 하나는 인덱싱 작업에, 다른 하나는 쿼리 작업에 사용하는 것이 가장 좋습니다. 다른 프로젝트.

배포서버 후 다음을 수행합니다.

  1. 컬렉션 에서 시맨틱 검색 활성화 하려는 텍스트 필드 선택합니다.

  2. 사용 가능한 임베딩 모델 목록에서 임베딩 모델을 선택합니다.

  3. MongoDB Vector Search 인덱스 정의에서 autoEmbed 유형을 사용하여 자동화된 임베딩을 구성합니다.

자동화된 임베딩을 위한 MongoDB Vector Search 인덱스 구성에 대해 자세히 학습 텍스트 필드 인덱싱을 참조하세요.

MongoDB Vector Search는 MongoDB Community Edition 초기화하는 동안 지정한API 키를 사용하여 삽입하거나 업데이트 기존 문서와 새 문서에 대한 임베딩을 자동으로 생성합니다.

참고

생성된 임베딩은 동일한 클러스터 의 별도 시스템 컬렉션 에 저장됩니다.

쿼리의 query.text 경우 파이프라인 $vectorSearch 단계에서 옵션을 사용합니다. MongoDB Vector Search는 인덱스 정의에서 동일한 임베딩 모델을 사용하여 텍스트 쿼리 에 대한 임베딩을 생성합니다. 파이프라인 단계에서 model 옵션을 사용하여 $vectorSearch 다른 임베딩 모델을 지정할 수 있지만, 지정된 임베딩 모델은 인덱스 시점에 사용된 임베딩 모델과 호환되어야 합니다. MongoDB Vector Search는 MongoDB Community 초기화 중에 제공한 쿼리 API 키를 사용하여 쿼리 시점에 임베딩을 생성합니다. 자세한 학습 은 텍스트 쿼리 실행을 참조하세요.

API 키를 사용하여 임베딩을 생성하면 요금이 발생합니다. 자세히 학습 비용을 참조하세요.

임베딩을 자동화하고 샘플 쿼리 실행 하려면 시작하기를 참조하세요.

인덱스 시점과 쿼리 시점에 임베딩을 생성하는 데 단일 API 키를 사용할 수 있지만, 쿼리 작업이 인덱싱 작업에 부정적인 영향을 미치지 않도록 하려면 별도의 API 키를 사용하는 것이 좋습니다.

다음과 같은 방법으로 API 키를 생성할 수 있습니다.

키를 생성한 후에는 MongoDB Community Edition 사용하여 배포서버 하는 동안 를 구성할 때 자동 임베딩에 사용할 키를 지정해야 합니다. MongoDB mongot Vector Search는 배포서버 중에 제공한 Voyage AI API 키를 사용하여 mongot 인덱스 의 데이터와 쿼리 시점의 쿼리 텍스트에 대한 임베딩을 자동으로 생성합니다.

MongoDB Vector Search는 각각 특정 사용 사례에 최적화된 Voyage AI의 최신 임베딩 모델과 통합됩니다.

임베딩 모델
설명

voyage-4-lite

비용에 민감한 대용량 애플리케이션에 최적화되어 있습니다.

voyage-4

(권장) 일반 텍스트 검색 위한 균형 잡힌성능.

voyage-4-large

복잡한 시맨틱 관계에 대한 정확도를 극대화합니다.

voyage-code-3

코드 검색 및 기술 문서화에 전문화되어 있습니다.

임베딩 모델 가격은 사용량을 기준으로 책정되며, 액세스 사용된 API 키에 연결된 계정으로 요금이 청구됩니다. 가격은 텍스트 필드 및 쿼리의 토큰 수를 기준으로 책정됩니다.

참고

임베딩 모델 및 LLM과 관련하여 토큰은 모델이 임베딩을 생성하거나 텍스트를 생성하기 위해 처리하는 단어, 하위 단어 또는 문자와 같은 텍스트의 기본 단위입니다. 토큰은 임베딩 모델 및 LLM 사용에 대한 요금이 청구되는 방식입니다.

Atlas 계정을 사용하여 생성한 API 키를 사용하는 경우, Atlas UI 에서 API 키 사용량을 모니터 할 수 있습니다. 자세한 학습 은 청구를 참조하세요.

Voyage AI 에서 직접 API 키를 생성한 경우 임베딩 서비스 엔드포인트에 대한 요청에 대한 요금에 대해 자세히 학습 가격 책정을 참조하세요.

Preview에서는 다음 배포서버 유형에 대해 자동 임베딩 기능을 아직 사용할 수 없습니다.

  • Atlas cluster

  • Atlas CLI 사용한 로컬 Atlas 배포

  • MongoDB Enterprise Edition

이 기능 Docker, tarball 또는 패키지 관리자를 사용하는 MongoDB Search 및 MongoDB Vector Search 배포 및 MongoDB 8.2 이상 Community Edition과 함께 Kubernetes 연산자용 MongoDB 컨트롤러를 사용하는 배포에만 사용할 수 있습니다.

다음 튜토리얼을 사용하여 벡터 임베딩을 자동으로 생성하도록 MongoDB Vector Search를 구성하는 방법을 학습 . 구체적으로 다음 조치를 수행합니다.

  1. 인덱스 시점에 임베딩을 자동으로 생성하려는 텍스트 데이터가 포함된 컬렉션 의 필드 를 인덱싱합니다.

  2. 쿼리 시점에 자동으로 생성된 임베딩을 사용하여 인덱싱된 필드에 대해 텍스트 쿼리 실행합니다.

이 튜토리얼에서는 sample_airbnb.listingsAndReviews 네임스페이스 사용하여summary 인덱스 타임에 임베딩을 자동으로 생성하는 컬렉션 에서 텍스트 필드 를 인덱스 , 다음에서 생성된summary 임베딩을 사용하여 인덱싱된 필드 에 대해 텍스트 쿼리 실행 방법을 보여 줍니다. 쿼리 시간.

이 튜토리얼을 완료하려면 다음 조건을 충족해야 합니다.

이 튜토리얼에서 만드는 인덱스 정의는 sample_airbnb.listingsAndReviews 컬렉션 에서 다음 필드를 인덱싱합니다.

  • summary 필드 autoEmbed 유형으로 지정하여 voyage-4 임베딩 모델을 사용하여 필드 의 텍스트 데이터에 대한 임베딩을 자동으로 생성합니다.

  • address.country 필드 filter 유형으로 지정하여 필드 의 문자열 값을 사용하여 시맨틱 검색 위한 데이터를 사전 필터링합니다.

  • bedroom 필드 filter 유형으로 지정하여 필드 의 숫자 값을 사용하여 시맨틱 검색 위한 데이터를 사전 필터링합니다.

이 인덱스 만들려면 다음을 수행합니다.

이 튜토리얼의 쿼리 다음을 수행합니다.

  1. sample_airbnb.listingsAndReviews 컬렉션 의 인덱싱된 summary 필드 에 대해 실행합니다.

  2. 다음 기준을 사용하여 속성을 사전 필터링합니다.

    • bedrooms이(가) 3 이상 있는 속성입니다.

    • 이름이 United Statescountry 의 속성입니다.

  3. voyage-4 임베딩 모델로 자동 생성된 임베딩을 사용하여 close to amusement parks 인 속성에 대한 시맨틱 검색 수행합니다. 쿼리:

    • 최대 100 개의 가장 가까운 이웃을 고려합니다.

    • 결과를 10 문서로 제한합니다.

이 쿼리 실행 하려면 다음을 수행합니다.

돌아가기

호환성 및 제한 사항

스킬 배지 획득

무료로 'MongoDB를 사용한 RAG'를 마스터하세요!

자세한 내용을 알아보세요.

이 페이지의 내용