주요 통합 솔루션
벡터 데이터베이스로서 Atlas의 다재다능함
독립형 또는 추가 기능 형태의 벡터 데이터베이스를 사용하는 대신, 다재다능한 Atlas 플랫폼을 활용하여 운영 데이터, 메타데이터, 벡터 임베딩을 Atlas에 저장하고 Atlas Vector Search를 통해 인덱싱, 검색 및 고성능 생성형 인공지능 애플리케이션 구축을 원활하게 진행할 수 있습니다.
강력한 AI 통합 에코시스템
FAQ
의미 검색이란 무엇입니까?
시맨틱 검색은 데이터 자체가 아닌 데이터의 의미를 검색하는 개념입니다.
벡터란 무엇입니까?
벡터는 고급 알고리즘을 사용하여 효율적으로 검색할 수 있는 데이터 및 관련 컨텍스트를 숫자로 표현한 것입니다.
Atlas Vector Search는 Atlas Search와 어떻게 다릅니까?
Atlas Vector Search는 벡터에 담긴 시맨틱, 즉 의미론적 뜻을 기반으로 데이터를 검색하는 반면, Atlas Search는 키워드 검색(즉, 실제 텍스트 및 정의된 동의어 매핑 기반)을 지원합니다.
독립형 벡터 데이터베이스 대신 MongoDB Atlas를 사용할 수 있나요?
네, MongoDB Atlas는 벡터 데이터베이스 기능을 제공합니다. Atlas는 완전 관리형 멀티 클라우드 개발자 데이터 플랫폼으로, 텍스트/어휘 검색 및 벡터 검색을 비롯한 다양한 기능을 제공합니다. 독립형 또는 추가 기능 형태의 벡터 데이터베이스를 사용하는 대신, 다재다능한 Atlas 플랫폼을 활용하여 운영 데이터, 메타데이터, 벡터 임베딩을 Atlas에 저장하고 Atlas Vector Search를 통해 인덱싱, 검색 및 고성능 생성형 인공지능 애플리케이션 구축을 원활하게 진행할 수 있습니다.
K-최근접 이웃 검색(KNN), 근사 최근접 이웃 검색(ANN), 정확한 최근접 이웃 검색(ENN)의 차이점은 무엇인가요?
K-최근접 이웃(KNN)은 서로 가까운 벡터를 찾는 데 자주 사용되는 알고리즘입니다.
근사 최근접 이웃(ANN)은 성능 향상을 위해 정확도를 일부 포기하고 유사한 벡터를 찾는 방식입니다. 이 알고리즘은 Atlas Vector Search의 핵심 알고리즘 중 하나입니다. MongoDB의 근사 최근접 이웃 검색 알고리즘은 수백만 개 벡터의 효율적인 인덱싱 및 쿼리를 위해 계층적 탐색 가능 소규모 세계(HNSW) 그래프를 사용합니다.
정확한 최근접 이웃(ENN)은 정확도 향상을 위해 성능을 일부 포기하고 유사한 벡터를 찾는 방식입니다. 이 방법은 limit 변수에 지정된 개수만큼 쿼리 벡터와 가장 가까운 벡터들을 정확하게 반환합니다. 정확한 벡터 검색 쿼리는 최대 10,000개 문서의 필터링되지 않은 쿼리에서 1초 미만의 지연 시간을 유지할 수 있습니다. 매우 선택적인 필터를 사용하여 광범위한 문서 집합을 벡터 관련성 순으로 정렬된 10,000개 이하의 문서로 제한하는 경우에도 낮은 지연 시간 응답을 제공할 수 있습니다.
$VectorSearch는 무엇이며 $search의 knnBeta 연산자와 어떻게 다릅니까?
검색 노드란 무엇인가요?
Atlas Vector Search는 어떤 벡터 임베딩을 지원하나요? 벡터 양자화가 지원되나요?
Atlas Vector Search는 서비스의 4096차원 제한 미만인 모든 제공업체의 임베딩을 지원합니다. 현재 선택한 제공업체의 스칼라 양자화 벡터 임베딩 수집, 인덱싱 및 쿼리를 지원합니다. 곧 Atlas에서 바이너리 양자화된 벡터 수집과 리스코어링 기능을 포함한 자동 스칼라 및 바이너리 양자화 지원을 추가하여 정확도 저하 없이 비용 및 저장 공간 효율성을 높일 예정입니다.
Vector Search는 이미지, 미디어 파일 및 기타 유형의 데이터에서 작동하나요?
예, Atlas Vector Search는 임베딩으로 변환할 수 있는 모든 종류의 데이터를 쿼리할 수 있습니다. 문서 모델의 이점 중 하나는 문서의 풍부한 데이터와 함께 임베딩을 저장할 수 있다는 것입니다.