ユースケース: 人工知能
業種: 医療
製品: MongoDB Atlas
ソリューション概要
医療部門のチームは、医療のサービスの品質を損なうドキュメントの危機に対処しています。オンポロジーのような特殊な単位では、ユーザーは多くの場合、数年の間に他の場所で再帰し、スキャンされたレポート、 PDF、パスに関する記事、イメージ化サマリー、ラボ 結果の長い追跡が行われます。これらのドキュメントは、多くの場合、切断されたデジタル システムに分散され、書込みコピーに物理的に保存されるため、各ユーザーのデータは断片化され、操作が困難です。
個々のケースを説明するには、 MDA を週次または月次で満たす必要があります。ただし、各設定の前に、コーディネーター、ナース、またはレジデンシーは、ストーリを再構築し、重要な情報を抽出し、競合を解決し、用語を正規化し、一貫性のあるタイムラインを構築する必要があります。その結果、これらのクリティカル プラクティスは、非構造化医療ドキュメントから重要なデータを手動で抽出するために多くの時間を費やすることになります。
この手動抽出は、医療上の決定事項を遅延させ、人間によるエラーを導入し、複数のユーザーのレコード全体に影響可能性のある不整合を引き起こします。その結果、ドキュメントを管理するためではなく、人の管理を選択した医療担当者の間で、医療の遅延、非効率的な操作、およびバーンアウトの増加が確認されます。
ここで説明するソリューションは、構成可能なテンプレートを使用して特殊なエンティティを抽出し、抽出された各ファクターをの出所とともに保存することで、その準備を自動化して、医療用語を迅速に検証できるようにします。 MongoDB は、テンプレート、抽出されたエンティティ、およびソース ドキュメントへのリンクバック用に、柔軟で監査可能なシステムのレコードを提供します。
ソリューション: AIによるドキュメント処理
AI駆動型医療レポート作成チャレンジ ジェネレーターは、この運用を戦略的な利点に変換します。高度な人工知能は医療ドキュメントを迅速に処理し、 PDF、画像、診断テキストなどの多くのドキュメント形式から特殊なエンティティを抽出します。
MongoDB の柔軟なドキュメント構造は、医療エンティティ間の関係を維持しつつ、 AIによって抽出された複雑なユーザ データを保存および整理します。システムは完全な MDM レポートを自動的に生成するため、準備時間が 時間から 分に短縮され、精度と一貫性が向上します。
MongoDB はテンプレートのバージョンも保存し、ソースドキュメントへのリンクを参照するため、MDT ドラフトのすべての要素を検証できます。
エンティティ テンプレートによるカスタマイズ可能な MDM
柔軟なテンプレートの定義を通じて、システムが抽出する情報を正確に制御します。医療チームは、特定のケース要件に一致するエンティティタイプ、処理ルール、集計戦略を定義します。インスタンス、オンコスト チームはテンプレートを構成してクラスター マークとステージング情報を抽出するためのテンプレートを構成しますが、濃度 チームは同じサービス内で異なる診断基準に専有できます。
したがって、このデモは MTT レポートを対象としていますが、テンプレート駆動型ワークフローはエンティティ テンプレートと形式ルールを更新することで任意のレポートタイプをサポートできます。
各テンプレートは、ソースドキュメントの優先順位、フィルタリング ルール、エンティティの説明、抽出手順、および出力形式を指定して、MDT レポートが診断結果と一致するようにします。このカスタマイズにより、一般的な出力が削除され、各部門の固有の要件に合わせて特別に設計されたレポートが提供されます。
データ集計とセキュリティ
医療チームは直感的なインターフェースを通じてドキュメントをアップロードできますが、 AIプロセスはユーザーの属性、診断、機能の正常性、診断履歴をリアルタイムで抽出します。ただし、データのプライバシーとセキュリティを確保するために、このデモではアップロード機能が無効になっており、処理は事前設定されたサンプルデータに対してのみ実行されます。
このプラットフォームは、複数のソースにわたる情報を集約し、フィルタリングルールを適用して、医療チームが顧客の医療履歴を確認するために使用できる構造化レポートを生成します。 MongoDB のスケーラブルなアーキテクチャは、医療環境に不可欠なデータの整合性とセキュリティ標準を維持しつつ、数百の同時ドキュメント処理リクエストを処理します。
この設計は 運用上の大きな影響を与えます 。このプラットフォームは、MDT ワークフローのボトルネックを削減し、より高速な処理計画をサポートし、クライアント情報をアクセス可能な方法でまとめます。実際には、これにより、チームはドキュメント要求の増加を処理し、リソースを最適化し、医療に費やす時間を増やすことができます。
参照アーキテクチャ
診断チームは、デモの事前定義されたデータセットから既存のユーザーを選択することで開始されます。これにより、関連付けられているすべての医療レコードが整理されたインターフェースに表示される診断ドキュメントの概要ページにリダイレクトされます。セキュリティ上の理由から、デモでは新しいドキュメントまたはクライアントの追加が制限されていますが、これらの機能は、システムセットアップ中に以下の構成手順で有効化できます。
クライアントの概要ページから、診断担当者は、その 診断レコードにすでに関連付けられている既存の医療ドキュメントを確認できます。このステージでは、ドキュメントは処理またはエンティティ抽出なしにMongoDBに保存される未加工ファイルとして存在します。完全な本番システムでは、チームは直感的なドラッグとドロップ機能を使用して新しいドキュメントをアップロードし、 PDF、医療画像、テキストファイル、XML ドキュメントなどの任意の形式を受け入れます。
図の 1。クライアントのドキュメントの概要
ドキュメントを処理する前に、診断担当者は インターフェースの右上セクションにあるメニューから テンプレート構成 にアクセスし、抽出要件をカスタマイズできます。この構成パネルにより、医療チームは、 AIツールが抽出するエンティティタイプ、処理ルール、および出力形式を正確に定義できます。このシステムには、ユーザー統計、診断、診断、特権などの医療エンティティの包括的なライブラリが付属しています。チームは、自分の特殊性に関連するエンティティのみを選択または作成できます。例、オンロールのチームは、カーディナリティやトラフィックのチームとは異なる抽出パラメーターを設定することができ、システムが特定の要件に適応していることを確認します。
図の 2。テンプレート定義プロセス
テンプレートがすでに構成されているため、診断担当者は、分析したいクライアントドキュメントバンドルごとにドキュメント処理を手動でトリガーできます。このアクションにより、ドキュメントがドキュメント プロセッサに入力されるエンティティ抽出フェーズが開始されます。ドキュメント プロセッサは OCR を使用して、画像やスキャンされたデータからテキストを抽出します。システムは形式の不整合を正規化し、 この実装ではAWS Red などの LM プロバイダーを介してコンテンツをインテリジェント分析用に準備します。 AI は事前構成されたテンプレートの仕様に従ってエンティティを抽出し、これらが抽出されたエンティティはソース ドキュメントにリンクされたMongoDBに保存されます。
ドキュメントが処理され、エンティティが抽出されると、医療提供者は MMD レポートを生成できます。 MDM レポート ジェネレーターは、 インターフェースのレポート セクションで別の関数として動作します。ジェネレーターは新しいエンティティ抽出を実行するのではなく、ドキュメント処理フェーズ中に以前に抽出され保存されたエンティティを集計して整理します。システムは、選択されたユーザーの複数の処理されたドキュメントのエンティティを組み合わせ、テンプレートの形式ルールを適用して、データを時系列で整理します。
図の 3。 MDM レポート ビューア
MDN レポートが生成されれば、フィールド チームは 観察可能性 セクションで比較するために、提供されたground Truth データを使用してAIパフォーマンスを検証できます。この評価機能により、医療関係者は検証済みエンティティの抽出を参照標準としてアップロードし、 AIが生成した MTT レポートと比較できます。この評価プロセスにより、チームは AI のパフォーマンス特性を理解し、特定の医療コンテキストで最適な結果が得られるようにテンプレート構成を調整するのに役立ちます。
このワークフロー全体の分離を通じて、 MongoDB は各コンポーネントの高速取得を可能にしながら、未加工のドキュメント、処理されたエンティティ、および生成されたレポート間で明確に維持します。
最後に、ユーザードキュメントから抽出された診断インサイトとAIシステム自体のパフォーマンス メトリクスの両方を包括的に理解することで、このジャーナルは終了します。このアプローチにより、チームは価値の高い MDP レポートを受け取るだけでなく、この MDP 生成の背後にあるAI処理の信頼性と精度にも信頼できるようになります。
図の 4。 AIベースのメトリクス レポート ジェネレーターのアーキテクチャ図
クリティカル エンティティ抽出におけるAIのロール
AI駆動型エンティティ抽出プロセスは、非構造化医療ドキュメントを実行可能な診断データに変換する主要インテリジェンスを表します。高度な LRM は、テンプレートを使用した命令とドメイン固有の理解性を組み合わせた高度なマルチステップ プロセス(図 5 で説明されている)に続いて、 プライマリ抽出エンジンとしてクラウドベースのAIサービスを通じて動作します。
図の 5。 AIワークフロー図
抽出プロセスは、処理されたドキュメントが Entity Extractor コンポーネントに到達したときに開始されます。ここで、LVM モデルは構成可能なテンプレートを通じて特定の指示を受け取ります。図 5 で説明されているように、これらのテンプレートは、特殊な処理ロジックを適用しながら、関連する医療概念に LM の注意を向ける詳細なプロンプトエンジニアリングとして機能します。
テンプレートで指定された各エンティティ定義は、正確な抽出パラメータを持つ LM を提供します。例、 診断日付 エンティティは、インストール日や診断開始日と区別して、 biopsy の診断日を検索するようモデルに指示します。 LVM は、正確な識別を確保するために、ドキュメントの種類、期待される形式、および診断上の重要性に関するコンテキストを受け取り、利用可能なドキュメントを処理するときにそのコンテキストと制約を適用します。
テンプレート システムには、LDM の抽出動作をガイド3 つの異なる処理タイプが実装されています。
一致処理: このメソッドは、ユーザー データベースのような確実なエンティティの初期の信頼インスタンスを抽出するようにモデルに指示します。
集計処理: 選択すると、ドロップ履歴などの蓄積情報のすべてのノードを収集するように LM に指示し、インテリジェントな重複重複除外ロジックを適用します。
ソースフィルタリングされた処理: 有効にすると、特定のエンティティを抽出するときに特定のドキュメントタイプを優先するようにモデルをガイドします。
テンプレート定義 ステップが完了し、新しいテンプレートが選択されると、LVM プロンプトフェーズが開始されます(図 2 を参照)。プラットフォームは、医療エンティティを抽出する高度なクエリを構築します。各クエリは、簡潔なシステムプロンプトで始まる標準化された構造に従います。
ドキュメントから関連データを抽出する名人です。以下を行う必要があります。
このシステムレベルの指示は、特定の 抽出タスクを提示する前に、LM のロールと専門知識のコンテキストを確立します。最後のクエリは、構造化された XML タグ内にドキュメントコンテンツとエンティティ仕様をカプセル化します。ドキュメントセクションには処理された医療テキストが含まれ、 エンティティ セクションには、各ターゲット エンティティに対する詳細な抽出手順が提供されます。このアプローチにより、LDM は明確で構造化されたディレクティブを受け取るようになります。
モデルによって生成された抽出されたエンティティは、最終製品(MDT レポート)を作成するためのインテリジェントな医療合成を可能にする構造化データになります。モデルのコンテキストに応じた理解により、抽出された概念間の論理的な関係が維持され、プラットフォームは以前に非構造化されていた医療情報から構造化された出力を構築できます。
この LVM を使用したアプローチでは、高度な言語モデルが、ドメイン固有のテンプレートとソースを認識する処理ロジックで適切にガイドされる場合、医療環境で効果的なツールとしてどのように機能するかが示されています。
その結果、このソリューションにより、医療チームは、数千の医療ドキュメントから意味を抽出する従来のプロセスを、医療の専門知識を強化する自動プロセスに変換することができます 。
ソリューションのビルド
README詳細な設定手順については、OpSampleRate ソリューション GitHubリポジトリ の に記載されている手順に従ってください。このリポジトリは、 AI駆動型メトリクス レポート ジェネレーターのデモ用にバックエンドとフロントエンドをホストします。
このデモを自分の環境で再現するには、次の手順に従います。
環境変数を設定する
./generate_env.shファイルを使用してテンプレート構成を生成します。
生成された .envファイルを特定の構成で更新します。
MONGODB_URI=mongodb+srv://<user>:<password>@<cluster-url>/?retryWrites=true&w=majority MONGODB_DB=your_database_name AWS_REGION=us-east-1 AWS_ACCESS_KEY_ID=your_access_key (if used) AWS_SECRET_ACCESS_KEY=your_secret_key (if used) SECRET_KEY=your_secure_secret_key LLM_PROVIDER=bedrock
成功するファイルを使用して両方のサービスを配置
2 つの異なるターミナルで、次のコマンドを実行してサービスを個別に開始します。
ターミナル 1: バックエンド
make backend
ターミナル 2: フロントエンド
make frontend
これらの手順を完了したら、完全に機能するAI駆動型 メトリクス 支援を使用できるようになります。次の URL ですべてのリソースが見つかります。
フロントエンド: http://localhost:3000
API docs: http://localhost:8000/docs
ヘルスチェック: http://localhost:8000/health
キーポイント
データ抽出を自動化し、手動エラーを削減します: PDF、スキャン、無料テキスト レポートから情報を手動で抽出するには、診断局に依存するとプロセスの効率が低下し、人間によるエラーが増加します。ユーザ履歴のサイズが大きく複雑になるにつれて、手動によるアプローチを維持すると、レコード間で不整合が発生し、医療上の決定が遅くなります。
AIを使用して診断チームを強化 : このコンテキストでのAIの値は独立した決定ではなく、非構造化データから構造化医療エンティティを迅速かつ一貫して抽出します。このAI駆動型ソリューションは、複数のドキュメントからの診断データを処理し、インサイトあるレポートを作成することで、決定ワークフローを変更せずにドキュメントの問題を管理するのに役立ちます。
テンプレートを使用して医療エンティティの抽出をカスタマイズします。データ要件によって、データ要件が異なります。オン件名、カード名、外文字のチームは、オブジェクト ドキュメントで同じシグナルを検索することはありません。このテンプレートベースのエンティティ抽出により、 AIシステムはさまざまな医療状況に調整できるようになり、出力が関連性があり、使用可能で、それぞれの特殊なニーズに一致していることが保証されます。
の出所と監査可能性を維持する: MongoDB は、テンプレート バージョンやの出所を含む完全な抽出コンテキストを保持し、抽出された各ファクトをそのソースに追跡できるようにします。
作成者
パトリシア・レナート・カルニセロ、MongoDB
Francesc Mateu Amengual, MongoDB
ユーザーの認証をサポートするためにMongoDB を使用しています