목차
- 생성형 인공지능, 벡터 데이터베이스, 그리고 MongoDB Atlas Vector Search
- 벡터 데이터베이스란 무엇인가요?
- 벡터 데이터베이스는 어떻게 작동하나요?
- 벡터 검색이 중요한 이유는 무엇인가요?
- 벡터 데이터베이스 사용 사례
- MongoDB Atlas Vector Search: 판도를 바꾸는 게임 체인저
- Atlas Vector Search: 시맨틱 검색으로 구동되는 지능형 애플리케이션을 위한 도구
- FAQ
생성형 인공지능, 벡터 데이터베이스, 그리고 MongoDB Atlas Vector Search
생성형 AI(일명 인공 지능)에 대해 많이 들어보셨을 겁니다. 의료, 금융, 소매, 정부 기관에 이르기까지 경제 전반에 걸쳐 여러 조직에서 생성형 인공 지능의 활용 방법을 모색하고 있습니다. CEO라면 누구나 가능한 한 빨리 애플리케이션을 출시하고 싶어하는 것으로 보입니다.
이는 단순한 관심 그 이상입니다. McKinsey 보고서에 따르면 생성형 인공지능은 세계 경제에 수조 달러를 유입시킬 수 있습니다.
이 혁신적인 기술의 핵심은 바로 벡터의 수학적 개념입니다. 생성형 인공지능은 벡터화와 대규모 언어 모델(LLM)의 뛰어난 성능을 통해 판도를 바꿀 잠재력을 실현합니다. 생성형 인공지능 시대에는 벡터 임베딩이 기반을 마련하고, 벡터 데이터베이스가 그 영향력을 증폭시킵니다.
벡터 데이터베이스란 무엇인가요? 어떻게 작동하나요? 일반적인 사용 사례에는 어떤 것이 있나요? MongoDB Atlas Vector Search가 생성형 인공지능 논의에서 중요한 역할을 하는 이유는 무엇인가요?
벡터 데이터베이스란 무엇인가요?
벡터 데이터베이스를 이해하려면 먼저 벡터를 이해해야 합니다.
수학과 물리학에서 벡터는 크기(또는 규모)와 방향을 모두 가진 양을 말합니다. 벡터는 구성 요소로 나눌 수 있습니다. 예를 들어, 2차원 공간에서 벡터는 X(가로) 및 Y(세로) 구성 요소를 갖습니다.
데이터 과학과 머신 러닝에서 벡터는 데이터를 나타내는 정렬된 목록 또는 숫자 시퀀스를 말합니다. 벡터는 텍스트, 이미지, 오디오, 동영상 등 비정형 데이터(또는 미리 정의된 데이터 모델이나 스키마가 없는 데이터)를 포함한 모든 유형의 데이터를 나타낼 수 있습니다. 벡터는 일반적으로 배열 또는 숫자 목록으로 표현되며, 이 목록의 각 숫자는 해당 데이터의 특정 기능이나 속성을 나타냅니다.
예를 들어 대량의 고양이 사진 컬렉션이 있다고 가정해 보겠습니다. 각 이미지는 비정형 데이터의 일부입니다. 하지만 다음과 같은 특징을 추출하여 각 이미지를 벡터로 표현할 수 있습니다.
- 평균 색상
- 색상 히스토그램
- 질감 히스토그램
- 귀, 수염, 꼬리의 유무
벡터 임베딩(또는 벡터화)은 이러한 단어 및 기타 데이터를 숫자로 변환하는 과정으로, 각 데이터 포인트는 고차원 공간에서 벡터로 표현됩니다.
벡터 데이터베이스(벡터 검색 데이터베이스 또는 벡터 유사성 검색 엔진이라고도 함)는 벡터를 저장, 조회 및 검색합니다.
관계형 데이터베이스의 일반적인 행과 열 대신 벡터 데이터베이스는 데이터를 다차원 공간의 점으로 표현합니다. 벡터 데이터베이스는 정확한 값보다는 유사성을 기반으로 데이터를 빠르고 정확하게 일치시켜야 하는 애플리케이션에 이상적입니다.
“벡터 데이터베이스를 거대한 창고로, 인공지능을 숙련된 창고 관리자라고 상상해 보세요. 이 창고에서는 모든 항목(데이터)이 상자(벡터)에 저장되어 다차원 공간의 선반에 깔끔하게 정리되어 있습니다." Mark Hinkle, The New Stack
생성형 인공지능 애플리케이션을 구축하는 경우 벡터 데이터베이스는 방대한 양의 벡터화된 데이터를 효율적으로 처리하도록 맞춤화되어 쿼리 및 처리 속도가 빨라집니다.