팟캐스트 제작을 위한 생성형 인공지능과 데이터 저장을 위한 MongoDB를 결합하여 뉴스 방송을 자동화하고 확장하세요.
사용 사례: Gen AI
산업 분야: 미디어
제품: MongoDB Atlas, MongoDB 집계 프레임워크, MongoDB Atlas Vector Search
파트너: Google NotebookLM
솔루션 개요
오디오 콘텐츠에 대한 수요 급증으로 인해 뉴스 조직들은 일일 요약을 효율적으로 전달할 방법을 찾고 있습니다. 예를 들어, 팟캐스트는 미국에서만 연간9 백만 명의 청취자를 보유하고 있습니다. 그러나 이 프로세스를 자동화하는 것은 동적 기사 데이터를 관리하고 이를 고품질 오디오 경험으로 변환해야 하기 때문에 어려운 과제입니다.
MongoDB와 생성형 인공지능을 사용하여 팟캐스트 제작을 간소화하고 확장할 수 있는 뉴스 자동화 솔루션을 구축할 수 있습니다. MongoDB는 시스템의 핵심 데이터 레이어로 작동하며, 단일 MongoDB 컬렉션 내에서 유연하고 스키마가 없는 문서로 뉴스 기사를 효율적으로 관리합니다. 이 문서들은 제목, 내용, 발행일과 같은 정적 정보와 시간 경과에 따라 기사 성과와 인기도를 추적하는 동적 지표(예: 자격을 갖춘 읽기 수)를 모두 기록합니다. 감정 분석 및 주요 엔터티와 같은 파생 인사이트를 MongoDB 컬렉션에 저장하고 생성형 인공지능 파이프라인으로 이를 강화할 수 있습니다.
이 적응형 구조는 최신 뉴스와 메타데이터를 쿼리하고 추출할 수 있는 강력한 프레임워크를 제공합니다. 그런 다음 고급 언어 모델을 통합하여 이 정보를 오디오 팟캐스트로 변환할 수 있습니다. 이 기반을 마련하면 AI 기반 비즈니스 기회를 열고, 새로운 고객을 유치하며, 수익 스트림을 증가시킬 수 있습니다.
참조 아키텍처
이 프레임워크를 구현하려면 데이터 저장을 위해 MongoDB가 필요하고, 오디오 생성을 위해 AI 기반 음성 합성이 필요합니다. Google의 NotebookLM 모델을 사용하여 뉴스 텍스트를 정확한 억양과 속도로 다듬을 수 있습니다. 아래 다이어그램은 뉴스 요약을 오디오로 변환하는 워크플로를 설명합니다.
그림 1. AI 기반 텍스트-오디오 변환 아키텍처
기사 조회: 집계 및 Atlas Vector Search를 사용하여 데이터베이스에서 관련 뉴스 기사를 검색합니다.
팟캐스트 스크립트 생성: AI 파이프라인을 통해 기사를 전달하여 구조화된 다중 음성 AI 스크립트를 만듭니다.
오디오로 변환: 고급 텍스트-음성 모델을 사용하여 스크립트를 고품질 오디오로 변환한 후
.wav
파일로 저장합니다.전달 최적화: 생성된 팟캐스트를 캐시하여 사용자가 원활한 온디맨드 재생을 할 수 있도록 합니다.
이 프레임워크는 MP3 형식으로 인간 음성과 유사한 고품질 나레이션을 제공하여 전문적이며 매력적인 청취 경험을 제공합니다.
솔루션 빌드
MongoDB ist.media GitHub 리포지토리를 사용하여 텍스트-오디오 솔루션을 빌드하려면 다음 단계를 따르세요. 이 프레임워크를 영감으로 사용하여 자신만의 맞춤형 텍스트-오디오 파이프라인을 빌드할 수 있습니다.
ist.미디어 데모 배포
ist를 복제합니다. 미디어 github 리포지토리 이동하고 README
지침에 따라 데모를 배포 .
텍스트를 오디오로 변환을 생성합니다.
ist.미디어 데모에서 podcast.py 스크립트를 실행하세요. 이 스크립트는 AutoContent API를 사용하여 팟캐스트를 생성합니다. 그런 다음 파일 이름에 날짜(일/월/년)를 포함하여 다운로드하고 저장합니다.
주요 학습 사항
뉴스 데이터를 오디오 콘텐츠로 변환하는 미디어 솔루션을 만들려면 유연하고 빠르며 쉽게 확장할 수 있는 시스템이 필요합니다. MongoDB는 이러한 핵심 강점을 통해 이를 가능하게 합니다.
다양한 속성을 처리하는 문서 모델: 뉴스 데이터는 ID, 제목, 날짜, 본문과 같은 정적 필드, 읽은 횟수와 같은 동적 메타데이터, 키워드 및 기사 감정과 같은 AI 생성 인사이트, 시맨틱 검색을 위한 임베딩을 포함한 다양한 속성을 결합합니다. 문서 모델은 모든 요소를 지원하여 데이터베이스의 제한을 제거하고 시스템이 원활하게 발전할 수 있게 합니다.
운영 효율성을 보장하는 속도: MongoDB는 완전하고 독립적인 문서를 처리하여 복잡한 작업을 피하고, 기사 내용을 오디오 콘텐츠로 거의 실시간으로 변환할 수 있도록 더 빠르게 분석합니다.
성장을 가능케 하는 확장 가능한 시스템: MongoDB Atlas는 작은 변경 사항과 대량의 데이터를 원활하게 처리하여 미디어 애플리케이션이 성장함에 따라 높은 성능과 신뢰성을 보장합니다.
개발자를 강화하는 유연한 시스템: 고정된 스키마가 없으면 개발자는 AI 인사이트, 사용자 지표, 편집 업데이트와 같은 새로운 정보를 쉽게 추가할 수 있습니다. 이것은 변화하는 뉴스 소비에 적응하고 대응하는 것을 간단하게 만듭니다.
작성자
Benjamin Lorenz, MongoDB
Diego Canales, MongoDB