MongoDB 와 Agentic AI 사용하여 장비 장애를 예측하고 대응을 자동화하세요.
산업: 제조 및 모빌리티
제품: MongoDB Atlas, MongoDB Atlas Vector Search, MongoDB Time Series 컬렉션, MongoDB Node.js 드라이버
파트너: Amazon 기반, Amazon Web Services, LangChain, Vercel
솔루션 개요
제조 및 자동차 산업부터 에너지 및 유틸리티에 이르기까지 계획되지 않은 다운타임은 조직이 직면할 수 있는 가장 비용이 많이 드는 중단 중 하나입니다. 예측 유지 관리는 팀이 장애를 예측하는 데 도움이 되지만 장비는 점점 복잡해지고 공급망은 더욱 취약해지며 숙련된 인력을 찾기가 더 어려워집니다. 따라서 조직에는 자율적으로 예측하고 행동할 수 있는 시스템이 필요합니다.
AI 기반 에이전트를 사용하는 멀티 에이전트 시스템은LLM , 도구 및 에이전트 메모리를 활용하여 장애를 예측하고 그에 따라 조치를 취합니다. AI 에이전트는 반복적인 의사 결정을 자동화함으로써 숙련된 작업자가 문제 해결에 집중하는 동시에 비용을 줄이고 효율성 높일 수 활성화 .
그림 1. 운영 효율성을 위한 예측 유지 관리의 이점
이러한 이점은 다음과 같은 여러 산업에 적용 .
제조 및 자동차: 에이전트는 장비 이상을 감지하고 검사를 트리거하다 생산 작업 일정을 자동으로 조정할 수 있습니다.
운송 및 물류: 차량 운영자는 에이전트를 사용하여 차량 상태를 모니터 , 구성 요소 장애를 예측하고, 유지 관리 예정 다운타임을 최소화할 수 있습니다.
에너지 및 유틸리티: 상담원은 그리드 또는 터빈의 실시간 원격 측정을 분석 하고 문제가 감지되면 자동으로 수리팀을 파견할 수 있습니다.
항공 우주: 에이전트는 복잡한 시스템 전반에 걸쳐 진단을 조정하고 중단을 최소화하면서 유지 관리 조치를 실행할 수 있습니다.
이 솔루션은 제조 작업장에 중점을 둡니다. 그러나 다양한 시나리오에 동일한 아키텍처와 원칙을 적용 할 수 있습니다.
이 솔루션을 빌드 위해 멀티 에이전트 시스템은 에이전트가 효과적으로 추론하고, 학습 , 조치를 취할 수 있도록 하는 시기적절하고 상황에 맞는 데이터 액세스 에 의존합니다. 기존의 IT 및 OT 시스템은 이러한 확장하다 유연성에 맞게 설계되지 않았습니다.
범용 데이터베이스 MongoDB Atlas 벡터, 그래프 및 Time Series 데이터 에 대한 네이티브 지원 제공합니다. 에이전트형 AI 를 위한 산업 애플리케이션과 관련하여 Atlas 다음을 가능하게 합니다.
다양한 IoT 원격 측정 및 센서 입력을 실시간 수집합니다.
단기 및 장기 에이전트 메모리를 하나의 통합 데이터 계층에 저장합니다.
컨텍스트 인식 추론을 위해 RAG를 지원합니다.
안정적으로 확장하여 짧은 지연 시간 으로 대량의 스트리밍 데이터를 처리하다 .
MongoDB Atlas 산업 IoT 와 에이전트형 AI 연결하여 모니터링 및 예측에서 지능적이고 자동화된 조치 로 이동할 수 있도록 지원합니다.
참조 아키텍처
이 솔루션은 MongoDB Atlas, LangGraph, Amazon 침대록을 사용하여 멀티에이전트 예측 유지 관리 시스템을 빌드 방법을 보여줍니다. 이러한 기술이 함께 사용되면 이상 감지, 근본 원인 분석, 작업 주문 생성, 유지 관리 일정과 같은 복잡한 프로세스를 간소화할 수 있습니다.
상위 수준에서:
MongoDB Atlas 텔레메트리, 에이전트 메모리, 벡터 임베딩 및 기타 운영 데이터를 저장하고 인덱싱 통합 데이터 계층 역할을 합니다. 또한 에이전트에게 필요한 검색 도구를 제공합니다.
LangGraph를 사용하면 에이전트 간에 그래프 기반으로 조정할 수 있습니다.
Amazon 베드락은 에이전트가 추론, 분석 및 출력을 생성할 수 있는 LLM을 제공합니다.
아키텍처는 슈퍼바이저-에이전트 모델을 따릅니다. 감독자는 워크플로를 조정하고 다음과 같은 전문 상담원에게 작업을 위임합니다.
장애 에이전트: 근본 원인 분석을 수행하고 인시던트 보고서를 생성합니다.
작업 주문 상담원: 요구 사항, 기술 및 재료가 포함된 유지 관리 작업 주문의 초안을 작성합니다.
계획 에이전트: 프로덕션 및 리소스 제약 조건을 기반으로 최적의 유지 관리 슬롯을 식별합니다.
그림 2. 다중 에이전트 예측 유지 관리 시스템의 상위 수준 아키텍처
이 아키텍처의 각 에이전트 는 도구, 메모리 및 상태 그래프 사용합니다. 이러한 구성 요소를 통해 에이전트는 조정된 방식으로 추론하고, 상기하고, 행동할 활성화 .
에이전트 도구
도구는 에이전트가 외부 시스템과 상호 작용 수 있도록 하는 도메인별 기능입니다. 데이터베이스 쿼리를 호출하거나, 시맨틱 검색 수행하거나, 구조화된 출력을 다시 MongoDB 에 쓰기 (write) 수 있습니다.
아래 코드는 MongoDB Node.js 운전자 사용하여 장애 에이전트용 도구를 등록하는 방법을 보여줍니다. 예시 에서 이 도구는 벡터 검색을 사용하여 기계의 매뉴얼에서 관련 섹션을 조회 .
export const retrieveManual = tool( async ({ query, n = 3 }) => { const dbConfig = { collection: "manuals", indexName: "default", textKey: ["text"], embeddingKey: "embedding", includeScore: true, }; const result = await vectorSearch(query, dbConfig, n); return JSON.stringify(result); }, { name: "retrieve_manual", description: "Retrieve the relevant manual for the alert via vector search.", schema: { type: "object", properties: { name: { type: "string", description: "Name of the tool for identification purposes", enum: ["retrieve_manual"], }, query: { type: "string", description: "The query to process", }, n: { type: "number", description: "Number of results to return (optional, default 3)", default: 3, }, }, required: ["name", "query"], }, } ); export function getTools() { return [ retrieveManual, retrieveWorkOrders, retrieveInterviews, generateIncidentReport, ]; }
각 에이전트 에는 다음 목록에 표시된 대로 고유한 툴킷이 있습니다.
장애 에이전트
retrieveManual
: 매뉴얼에서 문제 해결 단계를 검색합니다.retrieveWorkOrders
: 유사한 과거 수리를 조회합니다.retrieveInterviews
: 과거 사고 후 분석에 대한 연산자 또는 기술자 노트를 찾습니다.generateIncidentReport
: 인시던트 보고서를 생성하여 MongoDB 에 저장합니다.
작업 주문 에이전트
retrieveWorkOrders
: 지침 위해 과거 작업 주문을 참조합니다.generateWorkOrder
: 예상 기간, 필요한 기술 및 재료가 포함된 새 주문을 작성합니다.
계획 에이전트
checkInventoryAvailability
: 필요한 부품의 주식 있는지 확인합니다.checkStaffAvailability
: 적합한 기술을 갖춘 기술자를 찾습니다.scheduleWorkOrder
: 작업 프로덕션 캘린더에 예약합니다.
이 도구 세트를 확장할 수도 있습니다. 예시 를 들어, 새로운 기능을 추가하여 고유한 비즈니스 프로세스나 업계별 요구 사항을 반영할 수 있습니다.
에이전트 메모리
에이전트가 효과적으로 작동하려면 컨텍스트 및 추론 단계를 저장 위한 자체 메모리 가 필요합니다. 이를 통해 다음을 수행할 수 있습니다.
작업 내에서 연속성을 유지합니다.
이전 단계를 상기합니다.
상호 작용 전반에 걸쳐 컨텍스트를 구축합니다.
이 아키텍처에서 MongoDB Atlas 메모리를 저장합니다. 메모리는 다음과 같습니다.
단기 기억: 에이전트 상태 그래프 이동할 때 중간 상태 저장합니다. 이렇게 하면 프로세스 중단되더라도 진행 상황이 손실되지 않고 재개될 수 있습니다. 이 솔루션에서는 두 개의 컬렉션이 이러한 유형의 메모리를 저장 .
checkpoints
: 각 단계에서 에이전트 의 일반적인 상태 캡처합니다.checkpoints_writes
: 도구 호출 및 출력을 기록합니다.
장기 기억: MongoDB 현재 결정을 알리는 과거 데이터를 저장합니다. 에이전트는 벡터 검색 통해 이 데이터를 조회 기록 컨텍스트가 추론을 유도하도록 합니다. 컬렉션에는 다음이 포함됩니다.
interviews
: 사고 후 기사와의 인터뷰 및 메모.workorders
: 작업 주문 기록 내역.incident_reports
: 이전 사고 요약 및 결과.
단기 기억을 MongoDBSaver
구성하려면 checkpoints
checkpoints_writes
다음과 같이 및 컬렉션에 에이전트 진행 상황을 기록하는 LangGraph의 클래스를 사용할 수 있습니다.
import { MongoDBSaver } from "@langchain/langgraph-checkpoint-mongodb"; import { MongoClient } from "mongodb"; const client = new MongoClient("<connection-string>"); const checkpointer = new MongoDBSaver({ client: client, dbName: "<database-name>", checkpointCollectionName: "checkpoints", checkpointWritesCollectionName: "checkpoints_writes" });
이 설정 통해 에이전트의 메모리 및 내결함성 기능을 활성화할 수 있습니다.
에이전트 상태 그래프
상태 그래프 워크플로를 노드와 에지로 모델링하기 위한 프레임워크 입니다. 각 노드 추론 단계, 도구 호출 또는 체크포인트 나타냅니다. 가장자리는 이러한 단계 간의 전환을 정의합니다. 상태 그래프는 워크플로를 명시적이고 반복 가능하며 복원력 있게 만듭니다.
이 솔루션에서 LangGraph는 에이전트와 에이전트의 도구를 조정할 수 있는 상태 그래프 제공합니다. 노드는 전문 에이전트 또는 감독자의 결정을 나타내고, 에지는 실행 순서를 정의합니다.
이 아키텍처는 다음을 보장합니다.
에이전트는 결과에 따라 분기할 수 있습니다. 예시 를 들어 누락된 부품과 사용 가능한 부품이 있습니다.
각 단계는 메모리에 쓰고 자동으로 읽습니다.
슈퍼바이저 에이전트는 특수 에이전트를 조정하여 작업을 협업하여 해결합니다.
아래 코드는 이전 코드 예시 에서 단기 기억에 사용된 수퍼바이저, 특수 에이전트, checkpointer
를 연결하는 상태 그래프 를 빌드합니다.
const graph = new StateGraph(StateAnnotation) .addNode("supervisor", callModel) .addNode("failure", agentNode(failureGraph, "failure")) .addNode("workorder", agentNode(workorderGraph, "workorder")) .addNode("planning", agentNode(planningGraph, "planning")) .addEdge("__start__", "supervisor") .addConditionalEdges("supervisor", shouldContinue) .addEdge("failure", "supervisor") .addEdge("workorder", "supervisor") .addEdge("planning", "supervisor") .compile({ checkpointer });
이 그래프 설정 사용하면 전체 멀티 에이전트 워크플로를 추적, 재개 및 디버깅할 수 있습니다.
엔드 투 엔드 워크플로
에이전트가 협업하는 방법은 다음과 같습니다.
슈퍼바이저 에이전트는 경고 수신하고 상태 그래프 통해 경고를 기록하고 실패 에이전트에게 전달합니다.
실패 에이전트는 도구를 사용하여 매뉴얼, 작업 주문, 인터뷰를 쿼리 컨텍스트에 대한 장기 기억을 참조합니다. 그런 다음 인시던트 보고서를 생성합니다.
작업 주문 상담원은 필요한 재료, 기술 및 예상 기간을 사용하여 새 작업 주문의 초안을 작성합니다. 메모리를 사용하여 출력에 올바른 요구 사항과 도구를 적용 .
체크포인트 실행 전에 주문의 유효성을 검사합니다.
계획 에이전트는 자체 도구 세트와 메모리를 사용하여 부품 가용성, 직원 일정 및 일정 충돌을 확인합니다. 그런 다음 작업 예약합니다.
모든 에이전트가 작업을 완료하면 슈퍼바이저 에이전트가 상태 그래프 업데이트하여 워크플로 완료를 추적 .
다음과 같은 새 에이전트를 사용하여 이 워크플로를 확장하고 사용자 지정할 수 있습니다.
부품을 자동으로 주문하는 조달 에이전트 입니다.
규정 보고서를 준비하는 컴플라이언스 에이전트 .
기술자 워크로드의 균형을 맞추는 교대 최적화 에이전트 .
도구, 메모리 및 그래프 오케스트레이션이 모듈식이므로 기존 에이전트를 중단하지 않고 새 에이전트를 추가할 수 있습니다.
데이터 모델 접근 방식
다중 에이전트 예측 유지 관리 시스템은 다음을 포함한 범위 데이터를 사용합니다.
고주파 센서 판독값
에이전트 메모리
기술 매뉴얼
휴먼인터뷰 노트
직원 일정
인벤토리 레코드
MongoDB의 유연한 문서 모델 사용하면 이 데이터를 단일 솔루션에서 쉽게 운영할 수 있습니다. MongoDB Atlas 에서는 저장 수 있습니다.
밀리초 단위의 원격 분석을 위한 Time Series 데이터입니다.
매뉴얼 및 작업 주문 전반에서 시맨틱 검색 위한 벡터 임베딩입니다.
컨텍스트를 통합하기 위한 메타데이터(예: 공장 ID, 기계 ID 또는 생산 라인)입니다.
일정, 캘린더 및 인벤토리에 대한 운영 데이터입니다.
메인 컬렉션
이 솔루션은 다음 컬렉션을 사용하여 다양한 데이터를 저장 .
telemetry
: 효율적인 수집, 압축 및 쿼리를 위해 time series 컬렉션 으로 저장되는 작업 현장의 기계 센서 판독값입니다. 시계열 컬렉션을 사용하면 수백만 개의 판독값을 효율적으로 저장 하고 쿼리 할 수 있습니다. 또한 기계, 공장 또는 생산 라인 식별자와 같은 상황별 메타데이터 도 보존합니다.alerts
: 워크플로 트리거하다 하고 슈퍼바이저 상담원에게 알리는 예측된 문제 또는 이상 현상입니다.incident_reports
: Failure Agent에서 생성된 근본 원인 분석 결과입니다. 결과는 원격 측정, 매뉴얼 및 인터뷰를 통해 컨텍스트를 집계합니다.work_orders
: 작업 주문 에이전트가 초안을 작성합니다. 작업 설명, 예상 기간, 필요한 기술 및 자료가 포함됩니다.manuals
: 에이전트가 의미론적으로 검색할 수 있도록 벡터 임베딩과 함께 저장된 기계 매뉴얼.interviews
: 사고 후 메모와 직원과의 대화를 통해 구조화되지 않았지만 귀중한 컨텍스트를 제공합니다.maintenance_staff
: 계획 에이전트가 사용하는 직원 명부, 교대 근무 일정 및 스킬 전문화입니다.inventory
: 예비 부품 가용성, 비용 및 리드 타임. 일정 예약 및 조달 결정에 중요합니다.production_calendar
: 프로덕션 작업, 우선 순위 수준 및 허용 가능한 지연. 업무 중단이 가장 적은 유지 관리 기간 식별하는 데 사용됩니다.checkpoints
및checkpoints_writes
: 에이전트의 상태 캡처하고 도구 호출 및 출력에 대한 로그를 기록합니다.
telemetry
컬렉션 에 있는 샘플 문서 의 예시 는 다음 코드 차단 참조하세요.
{ "ts": { "$date": "2025-08-25T08:53:06.052Z" }, "metadata": { "factory_id": "qro_fact_1", "machine_id": 1, "prod_line_id": 1 }, "_id": { "$oid": "68ac24720d4c459561c42a4e" }, "vibration": 0.209, "temperature": 70.69 }
time series 문서 다음 필드가 포함되어 있습니다.
ts
읽기의 타임스탬프를 포함합니다.metadata
공장, 기계 및 생산 라인에 대한 컨텍스트 태그를 통합합니다.vibration
및temperature
은 숫자 센서 값으로 구성됩니다.
솔루션 빌드
이 솔루션의 전체 데모 구현 보려면 해당 GitHub 리포지토리 참조하세요. 다음 단계를 더 자세히 다루는 README
리포지토리의 를 따르세요.
필수 구성 요소 설정 및 설치
Node.js 18+를 설치하고, MongoDB Atlas cluster 구성하고, Amazon 기반에 대한 액세스 설정하다 합니다.
리포지토리 복제하고 해당 종속성을 설치합니다.
git clone git@github.com:mongodb-industry-solutions/multiagent-predictive-maintenance.git cd multiagent-predictive-maintenance npm install
다음 명령을 사용하여 환경 변수를 복사합니다.
cp .env.example .env
그런 다음 자격 자격 증명 으로 값을 업데이트 .
주요 학습 사항
에이전트형 AI 활용: 멀티에이전트 시스템은 작업을 자율적으로 모니터 하고 추론하고 실행할 수 있으므로 워크플로를 간소화하고 효율성 높일 수 있습니다.
최신 데이터 기반 구축: AI 에이전트를 확장하다 로 효과적으로 운영하려면 지연 시간이 짧고 성능이 확장 가능한 데이터 인프라가 필수적입니다.
IoT 와 AI 의 원활한 통합: MongoDB Atlas 원격 측정, 벡터 임베딩, 에이전트 메모리 및 검색을 위한 통합 데이터 계층을 제공합니다. 이를 통해 산업 환경에서 안정적이고 안전하며 유연한 에이전트 워크플로를 사용할 수 있습니다.
예측에 따라 신속하게 조치: 인사이트를 자동화된 조치 로 전환하여 운영 효율성을 높이세요.
작성자
Humza Akthar, MongoDB
Raphael Schor, MongoDB
Rami Pinto, MongoDB
자세히 알아보기
예측 유지 관리의 멀티 에이전트 AI 개념을 알아보려면 예측 유지 관리를 위한 멀티 에이전트 AI 잠금 해제 블로그 읽어보세요.
솔루션의 작동 방식을 알아보려면 이 YouTube 동영상을 시청하세요.
이 데모를 설정하다 하려면 GitHub 리포지토리 방문하세요.
MongoDB 제조 및 자동차 애플리케이션을 지원하는 방법을 학습 제조 및 모바일용 MongoDB 참조하세요.
MongoDB 사용하여 AI 기반 애플리케이션을 빌드 방법을 알아보려면 인공 지능용 MongoDB 방문하세요.