使用案例: 人工智能
行业: 医疗保健
产品: MongoDB Atlas
解决方案概述
医疗团队面临文档危机,威胁患者护理质量。在肿瘤科等专业科室中,患者通常在其他地方接受多年护理后来到这里,并有一长串扫描报告、PDF、病理叙述、影像摘要和实验室结果。这些文档通常分散在互不相连的数字系统中,但实际上仍以纸质副本形式存储,导致每位患者的数据支离破碎且难以浏览。
为了讨论个别患者案例, MDT 每周或每月举行一次会议。然而,在每次会议之前,协调员、护士或住院医师都必须重建故事,提取关键事实,解决矛盾,规范术语并构建连贯的时间表。因此,这些临床医生最终要花费大量时间从非结构化医疗文档中手动提取关键数据,只是为了汇总患者的病史。
这种手动提取方式会减慢临床决策速度,引入人为错误,并造成不一致,从而影响对患者记录的护理。其结果是医疗保健延误、操作效率低下,以及医疗保健专业人员日益感到倦怠,他们选择医学来照顾病人,而不是管理文件。
这里描述的解决方案通过使用可配置模板提取特定于专业的实体,并存储每个提取的事实及其来源,以便临床医生可以快速验证它,从而自动执行准备工作。 MongoDB为模板、提取的实体及其返回源文档的链接提供了灵活、可审核的记录系统。
解决方案: AI支持的文档处理
AI支持的医疗报告生成器将这一运营挑战转化为战略优势。高级人工智能可快速处理医疗文档,从多种文档格式(包括 PDF、图像和临床文本)中提取专门的实体。
MongoDB 灵活的文档结构可存储和组织AI提取的复杂患者数据,同时维护医疗实体之间的关系。系统自动生成完整的 MDT 报告,将准备时间从几小时缩短为几分钟,同时提高准确性和一致性。
MongoDB还存储模板版本和指向源文档的引用链接,因此 MDT 草稿中的每个事实都可以得到验证。
通过实体模板自定义 MDT
临床医生通过灵活的模板定义精确控制系统提取哪些信息。医疗团队定义符合其特定案例要求的实体类型、处理规则和聚合策略。实例,当肿瘤学团队配置模板以提取肿瘤标志物和分期信息时,心脏团队可以在同一服务中专注于不同的诊断标准。
因此,虽然此演示针对的是 MDT 报告,但模板驱动的工作流可以通过更新实体模板和格式设置规则来支持任何报告类型。
每个模板指定源文档优先级、筛选规则、实体描述、提取指令和输出格式,以确保 MDT 报告与临床首选结果保持一致。这种定制删除了通用输出,并提供了专为每个医学专业的独特要求设计的报告。
数据聚合和安全
医疗团队可以通过直观的界面上传文档,而AI进程则实时提取患者的人口统计信息、诊断、分子异常和治疗历史。但是,为了确保数据隐私和安全,在此演示中,禁用了上传功能,并且仅对预设示例数据运行处理。
该平台汇总多个来源的信息,应用过滤规则并生成结构化报告,临床团队可以使用这些报告检查患者的病史。 MongoDB 的可扩展的架构可同时处理数百个文档处理请求,同时保持医疗保健环境所必需的数据完整性和安全标准。
这种设计对运营产生了有意义的影响。该平台有助于减少 MDT 工作流程中的瓶颈,支持更快地制定治疗计划,并以易于访问的方式汇集患者信息。实际上,这可以帮助团队处理不断增长的文档需求,优化资源,并将更多时间花在患者护理上。
参考架构
临床团队首先从演示的预定义数据集中选择一名现有患者,将其重定向到患者文档概述页面,在该页面中,所有相关的医疗记录都显示在井井有条的界面中,从而开始其旅程。出于安全考虑,该演示限制添加新文档或患者,但可以在系统设置期间通过以下配置步骤激活这些功能。
在患者概览页面中,临床医生可以查看已与该患者记录相关联的现有医疗文档。在此阶段,文档作为原始文件存储在MongoDB中,未经任何处理或实体提取。在完整的生产系统中,团队可以通过直观的拖放功能上传新文档,接受任何格式,包括 PDF、医学图像、文本文件和 XML 文档。
图 1。患者文件概述
在处理文档之前,临床医生可以通过界面右上方的菜单访问模板配置,从而自定义提取要求。此配置面板允许医疗团队准确定义AI工具应提取的实体类型、处理规则和输出格式。该系统附带一个全面的医疗实体库,包括患者人口统计、诊断、治疗和分子标记物。团队只能选择或创建与其专业相关的实体。示例,肿瘤学团队可以配置与心脏病学或创伤学团队不同的提取参数,确保系统适应特定要求。
图 2。模板定义进程
通过已配置的模板,临床医生可以手动触发他们想要分析的每个患者文档包的文档处理。此动作将启动实体提取阶段,文档在此阶段进入文档处理器,文档处理器使用 OCR 从图像和扫描材料中提取文本。系统将格式不一致规范化,并通过 LLM提供商(例如用于此实施的AWS 基岩)准备用于智能分析的内容。 AI根据预先配置的模板规范提取实体,然后将这些提取的实体存储在链接到其源文档的MongoDB中。
处理文档并提取实体后,临床医生可以生成 MDT 报告。 MDT 报告生成器作为界面报告部分的独立功能运行。生成器不是执行新的实体提取,而是聚合和组织先前在文档处理阶段提取和存储的实体。系统会合并所选患者的多个已处理文档中的实体,应用模板格式设置规则,并按时间顺序组织数据。
图 3。 MDT 报告查看器
生成 MDT 报告后,临床团队可以使用提供的地面实况数据验证AI性能,以便在可观察性部分进行比较。此评估功能允许医疗专业人员上传经过验证的实体提取作为参考标准,并将其与AI生成的 MDT 报告进行比较。此评估进程可帮助团队了解 AI 的性能特征,并完善模板配置,从而在特定的临床环境中获得最佳结果。
在整个工作流程中, MongoDB保持原始文档、已处理实体和生成报告之间的明确分离,同时能够快速检索每个组件。
最后,我们将全面了解从患者文档中提取的临床见解以及AI系统本身的性能指标,从而结束这段旅程。这种方法确保团队不仅能收到有价值的 MDT 报告,还能对这一代 MDT 背后的AI处理的可靠性和准确性充满信心。
图 4。 AI支持的医疗报告生成器架构图
AI在临床实体提取中的作用
AI驱动的实体提取进程代表了将非结构化医疗文档转换为可操作的临床数据的核心智能。高级法学硕士通过基于云的AI服务作为主节点 (primary node in the replica set)提取引擎,遵循复杂的多步骤进程(如图 5 所示),将模板驱动的指令与特定领域的理解结合起来。
图 5。 AI工作流程图
当处理后的文档到达实体提取器组件时,提取进程开始,其中 LLM 模型通过可配置模板接收特定指令。如图 5 所示,这些模板充当详细的提示工程,将法学硕士的注意力引向相关的医学概念,同时应用特定于专业的处理逻辑。
模板中指定的每个实体定义都为 LLM 提供了精确的提取参数。示例,“诊断日期”实体指示模型找到活检诊断日期,同时将其与症状出现或开始治疗的日期区分开来。法学硕士接收有关文档类型、预期格式和临床意义的上下文,以确保准确识别,并在处理可用文档时应用该上下文和约束。
模板系统实现了三种不同的处理类型,用于指南LLM 的提取行为:
匹配处理:此方法指示模型提取确定实体(例如患者人口统计数据)的初始可靠实例。
聚合处理:选择此选项后,它会指示法学硕士收集所有提及累积信息(例如用药史)的内容,然后应用智能去重逻辑。
源过滤处理:如果启用,它将指导模型在提取特定实体时对特定文档类型进行优先级排序。
完成模板定义步骤并选择新模板后,“LLM 提示”阶段开始(参见图 2)。该平台构建提取医疗实体的高级查询。每个查询都遵循标准化结构,以简洁的系统提示开头:
您是从文档中提取相关数据的专家。您必须……
该系统级说明在呈现特定提取任务之前建立了法学硕士的角色和专业知识背景。最终查询将文档内容和实体规范封装在结构化 XML 标签中。文档部分包含已处理的医疗文本,而实体部分则提供每个目标实体的详细提取说明。这种方法可确保法学硕士收到清晰且结构化的指示。
模型生成的提取实体成为结构化数据,支持智能临床综合,从而创建最终产品 MDT 报告。该模型的上下文理解保留了提取的概念之间的临床关系,允许该平台从以前的非结构化医疗信息构建结构化输出。
这种由法学硕士提供支持的方法演示了,在通过特定领域的模板和源感知处理逻辑进行正确引导时,高级语言模型如何提供服务临床环境中的有效工具。
因此,该解决方案使医疗团队能够将从数千份临床文档中提取含义的传统挑战转变为增强临床专业专业知识的自动化进程。
构建解决方案
有关详细的设置说明,请按照行业解决方案README GitHub存储库 的 中概述的步骤进行操作。此存储库托管AI支持的医疗报告生成器演示的后端和前端。
要在自己的环境中重现此演示,请按照以下步骤操作:
配置环境变量
使用 ./generate_env.sh文件生成模板配置。
使用特定配置更新生成的 .env文件:
MONGODB_URI=mongodb+srv://<user>:<password>@<cluster-url>/?retryWrites=true&w=majority MONGODB_DB=your_database_name AWS_REGION=us-east-1 AWS_ACCESS_KEY_ID=your_access_key (if used) AWS_SECRET_ACCESS_KEY=your_secret_key (if used) SECRET_KEY=your_secure_secret_key LLM_PROVIDER=bedrock
使用生成文件部署这两项服务
在两个不同的终端中,执行以下命令以独立启动服务:
终端 1:后端
make backend
终端 2:前端
make frontend
完成这些步骤后,您就可以使用功能齐全的AI驱动的医疗助手。您可以在以下 URL 找到所有资源:
API docs: http://localhost:8000/docs
关键要点
自动提取数据并减少人为错误:依赖临床医生从 PDF、扫描件和自由文本报告中手动提取信息,不仅导致流程效率低下,而且增加了人为错误造成的错误。随着患者病史的增加和复杂性的增加,保持手动方法会导致记录之间的不一致,并减缓临床决策的速度。
使用AI增强临床团队:在这种情况下, AI的价值不在于自主决策,而在于从非结构化数据中快速、一致提取结构化医疗实体。通过处理来自多个文档的临床数据并创建富有洞察力的报告,这种AI驱动的解决方案可帮助临床团队在不改变决策工作流程的情况下管理文档挑战。
使用模板自定义医疗实体提取:不同的医学专业有不同的数据要求。肿瘤学、心脏病学和创伤学团队不会在患者文档中寻找相同的信号。这种模板驱动的实体提取有助于AI系统适应不同的临床情况,确保输出相关、可用并符合每个专业的需求。
保留来源和可审核性: MongoDB有助于保留完整的提取上下文,包括模板版本和来源,使临床医生能够追踪每个提取的事实的来源。
作者
Patricia Renart Carnicero, MongoDB
Francesc Mateu Amengual, MongoDB
Sakshi Gark, MongoDB