이러한 분야별 컨텍스트 부족을 해결하기 위해 검색 증강 생성은 다음과 같이 수행됩니다.
- 최신 제품 카탈로그가 포함된 데이터베이스(주로 벡터 검색이 있는 데이터베이스)에서 가장 관련성이 높은 제품 설명을 가져옵니다.
- 그런 다음 이 설명을 LLM 프롬프트에 삽입(증강)합니다.
- 마지막으로 LLM이 질문에 답변할 때 이 최신 제품 정보를 '참조'하도록 지시합니다
위에서 고려해야 할 세 가지 사항
- 검색 증강 생성은 순전히 추론 시간(재학습 필요 없음) 기술입니다. 위의 1~3단계는 모두 추론 시간 내에 이루어집니다. 모델을 변경할 필요가 없습니다(예: 모델 가중치 수정).
- 검색 증강 생성은 LLM 생성의 실시간 사용자 지정에 적합합니다. 재학습이 필요하지 않고 모든 것이 컨텍스트 내 학습을 통해 수행되므로 RAG 기반 추론은 빠르며(지연 시간 100ms 미만) 실시간 운영 애플리케이션 내에서 사용하기 적합합니다.
- 검색 증강 생성은 LLM 생성을 더욱 정확하고 유용하게 만듭니다. 컨텍스트가 바뀔 때마다 LLM은 다른 응답을 생성합니다. 따라서 RAG는 검색된 컨텍스트에 따라 LLM 생성이 달라지도록 합니다.
복잡성을 최소화하여 RAG를 단순하게 유지하면서도 대규모로 안정적으로 작동할 수 있도록 정교하게 유지합니다.
성능이 뛰어나면서도 복잡성을 최소화하는 RAG 아키텍처를 달성하려면 올바른 시스템을 선택하는 것부터 시작해야 합니다. RAG 구현을 위한 시스템이나 기술을 선택할 때는 다음을 달성할 수 있는 시스템을 선택하는 것이 중요합니다.
- IT 운영에 엄청난 확장, 비용 및 복잡성을 추가하지 않고 새로운 벡터 데이터 요구 사항을 지원합니다.
- 구축된 생성형 AI 경험이 최소한의 지연 시간으로 실시간 데이터에 액세스할 수 있도록 합니다.
- 새로운 데이터 및 앱 요구 사항을 수용할 수 있는 유연성을 갖추고 개발 팀이 민첩성을 유지할 수 있도록 합니다.
- 개발 팀이 전체 AI 에코시스템에 데이터를 적용하는 것이 아니라 데이터에 전체 AI 에코시스템을 적용할 수 있도록 준비합니다.
옵션은 단일 목적의 벡터 데이터베이스부터 네이티브 벡터 기능을 갖춘 문서 및 관계형 데이터베이스, 데이터 웨어하우스 및 레이크하우스에 이르기까지 다양합니다. 그러나 단일 목적의 벡터 데이터베이스는 무분별한 확장과 복잡성을 즉시 가중시킵니다. 데이터 웨어하우스 및 레이크하우스는 본질적으로 RAG가 지원하는 생성형 AI 앱의 대용량, 짧은 지연 시간 및 최신 데이터 요구 사항과는 반대로 과거 데이터에 대한 장기 실행 분석 유형 쿼리를 위해 설계되었습니다. 또한 관계형 데이터베이스는 새로운 데이터 및 앱 요구 사항을 쉽게 추가할 수 있는 유연성을 제한하는 엄격한 스키마를 제공합니다. 이렇게 하면 네이티브 또는 내장 벡터 기능을 갖춘 문서 데이터베이스가 남습니다. 특히 MongoDB는 유연한 문서 모델을 기반으로 구축되었으며 네이티브 벡터 검색 기능을 갖추고 있어 모든 최신 애플리케이션을 위한 업계를 선도하는 데이터베이스일 뿐만 아니라 RAG용 벡터 데이터베이스이기도 합니다.
RAG 구현의 추가 기능을 통해 LLM의 성능을 한 단계 더 발전시킵니다.
핵심 구성 요소 외에도 RAG 구현에 추가하여 LLM의 성능을 한 단계 더 발전시킬 수 있는 여러 가지 추가 기능이 있습니다. 이러한 추가 기능 중 일부는 다음과 같습니다.
- 멀티모달리티: 멀티모달 RAG 모델은 텍스트 및 비텍스트(이미지, 동영상 및 오디오 등) 데이터를 기반으로 하는 텍스트를 생성할 수 있습니다. 이러한 멀티모달 데이터를 실시간 운영 데이터와 나란히 저장하면 RAG 구현을 보다 쉽게 설계하고 관리할 수 있습니다.
- 벡터 검색 쿼리에서 추가 필터 정의: 동일한 벡터 쿼리에 키워드 검색, 지리 공간 검색, 지점 및 범위 필터를 추가할 수 있는 기능을 통해 LLM에 제공되는 컨텍스트에 정확성과 속도를 더할 수 있습니다.
- 분야 특정성: 분야별 RAG 모델은 의료 또는 금융과 같은 특정 분야의 데이터에 대해 학습할 수 있습니다. 이를 통해 RAG 모델은 해당 분야에 대해 보다 정확하고 관련성 있는 텍스트를 생성할 수 있습니다.
전 세계로 나아갈 때 생성형 AI 기반 애플리케이션의 보안, 성능, 신뢰성, 확장 가능성을 보장합니다.
RAG로 구축된 생성형 AI 기반 애플리케이션이 전 세계로 나아갈 때 안전하고 성능이 뛰어나며 신뢰할 수 있고 확장 가능한지 확인하기 위해 수행할 수 있는 작업에는 여러 가지가 있습니다. 몇 가지는 다음과 같습니다.
- 안전하고 적절한 데이터 거버넌스 기능을 갖춘 플랫폼 사용: 데이터 거버넌스는 데이터의 보안, 비공개성, 정확성, 가용성, 사용성을 보장하기 위해 수행하는 모든 작업을 포괄하는 광범위한 용어입니다. 여기에는 데이터 수명 주기와 관련된 프로세스, 정책, 조치, 기술, 도구 및 제어가 포함됩니다. 따라서 플랫폼은 기본적으로 안전해야 하고, 엔드 투 엔드 암호화를 지원하며, 최고 수준의 규정 준수를 달성해야 합니다.
- 클라우드 기반 플랫폼 사용: 클라우드 기반 플랫폼이 제공하는 보안 및 확장성 기능 외에도 주요 클라우드 제공업체는 AI 인프라를 선도하는 혁신 기업 중 일부입니다. 클라우드에 구애받지 않는 플랫폼을 선택하면 팀이 어디에 있든 AI 혁신을 활용할 수 있습니다.
- 벡터 워크로드 인프라를 다른 데이터베이스 인프라와 분리할 수 있는 플랫폼 사용: 일반 OLTP 워크로드와 벡터 워크로드가 인프라를 공유하지 않도록 하여 두 워크로드가 각각에 최적화된 하드웨어에서 실행될 수 있으며 동일한 데이터를 활용하면서도 리소스를 두고 경쟁하지 않도록 하는 것이 중요합니다.
- 대규모로 검증된 플랫폼 사용: 공급업체가 확장할 수 있다고 말하는 것과는 별개로, 공급업체에게 글로벌 엔터프라이즈 고객과의 이력과 실적이 있나요? 미션 크리티컬 내결함성과 수평 확장 기능이 있으며 고객 사례를 통해 이를 입증할 수 있나요?
이러한 팁을 따르면 안전하고 성능이 뛰어나며 신뢰할 수 있고 확장 가능한 RAG 아키텍처로 생성형 기반 애플리케이션을 구축할 수 있습니다.
Atlas Vector Search의 도입으로 MongoDB의 선도적인 개발자 데이터 플랫폼은 대규모로 작동할 수 있는 정교하고 성능이 뛰어난 RAG 아키텍처를 구축할 수 있는 벡터 데이터베이스를 팀에 제공합니다. 이 모든 것이 최고 수준의 보안 및 클라우드 불가지론을 유지하면서, 가장 중요하게는 복잡성과 불필요한 비용을 더하지 않고도 가능합니다.