AI駆動型医療レポートジェネレーター

ユースケース: 人工知能

業種: 医療

ソリューション概要

医療部門のチームは、医療のサービスの品質を損なうドキュメントの危機に対処しています。オンポロジーのような特殊な単位では、ユーザーは多くの場合、数年の間に他の場所で再帰し、スキャンされたレポート、 PDF、パスに関する記事、イメージ化サマリー、ラボ結果の長い追跡が行われます。これらのドキュメントは、多くの場合、切断されたデジタルシステムに分散され、書込みコピーに物理的に保存されるため、各ユーザーのデータは断片化され、操作が困難です。

個々のケースを説明するには、 MDA を週次または月次で満たす必要があります。ただし、各設定の前に、コーディネーター、ナース、またはレジデンシーは、ストーリを再構築し、重要な情報を抽出し、競合を解決し、用語を正規化し、一貫性のあるタイムラインを構築する必要があります。その結果、これらのクリティカルプラクティスは、非構造化医療ドキュメントから重要なデータを手動で抽出するために多くの時間を費やすることになります。

この手動抽出は、医療上の決定事項を遅延させ、人間によるエラーを導入し、複数のユーザーのレコード全体に影響可能性のある不整合を引き起こします。その結果、ドキュメントを管理するためではなく、人の管理を選択した医療担当者の間で、医療の遅延、非効率的な操作、およびバーンアウトの増加が確認されます。

ここで説明するソリューションは、構成可能なテンプレートを使用して特殊なエンティティを抽出し、抽出された各ファクターをの出所とともに保存することで、その準備を自動化して、医療用語を迅速に検証できるようにします。 MongoDB は、テンプレート、抽出されたエンティティ、およびソースドキュメントへのリンクバック用に、柔軟で監査可能なシステムのレコードを提供します。

ソリューション: AIによるドキュメント処理

AI駆動型医療レポート作成チャレンジジェネレーターは、この運用を戦略的な利点に変換します。高度な人工知能は医療ドキュメントを迅速に処理し、 PDF、画像、診断テキストなどの多くのドキュメント形式から特殊なエンティティを抽出します。

MongoDB の柔軟なドキュメント構造は、医療エンティティ間の関係を維持しつつ、 AIによって抽出された複雑なユーザデータを保存および整理します。システムは完全な MDM レポートを自動的に生成するため、準備時間が時間から分に短縮され、精度と一貫性が向上します。

MongoDB はテンプレートのバージョンも保存し、ソースドキュメントへのリンクを参照するため、MDT ドラフトのすべての要素を検証できます。

エンティティテンプレートによるカスタマイズ可能な MDM

柔軟なテンプレートの定義を通じて、システムが抽出する情報を正確に制御します。医療チームは、特定のケース要件に一致するエンティティタイプ、処理ルール、集計戦略を定義します。インスタンス、オンコストチームはテンプレートを構成してクラスターマークとステージング情報を抽出するためのテンプレートを構成しますが、濃度チームは同じサービス内で異なる診断基準に専有できます。

したがって、このデモは MTT レポートを対象としていますが、テンプレート駆動型ワークフローはエンティティテンプレートと形式ルールを更新することで任意のレポートタイプをサポートできます。

各テンプレートは、ソースドキュメントの優先順位、フィルタリングルール、エンティティの説明、抽出手順、および出力形式を指定して、MDT レポートが診断結果と一致するようにします。このカスタマイズにより、一般的な出力が削除され、各部門の固有の要件に合わせて特別に設計されたレポートが提供されます。

データ集計とセキュリティ

医療チームは直感的なインターフェースを通じてドキュメントをアップロードできますが、 AIプロセスはユーザーの属性、診断、機能の正常性、診断履歴をリアルタイムで抽出します。ただし、データのプライバシーとセキュリティを確保するために、このデモではアップロード機能が無効になっており、処理は事前設定されたサンプルデータに対してのみ実行されます。

このプラットフォームは、複数のソースにわたる情報を集約し、フィルタリングルールを適用して、医療チームが顧客の医療履歴を確認するために使用できる構造化レポートを生成します。 MongoDB のスケーラブルなアーキテクチャは、医療環境に不可欠なデータの整合性とセキュリティ標準を維持しつつ、数百の同時ドキュメント処理リクエストを処理します。

この設計は運用上の大きな影響を与えます。このプラットフォームは、MDT ワークフローのボトルネックを削減し、より高速な処理計画をサポートし、クライアント情報をアクセス可能な方法でまとめます。実際には、これにより、チームはドキュメント要求の増加を処理し、リソースを最適化し、医療に費やす時間を増やすことができます。

参照アーキテクチャ

診断チームは、デモの事前定義されたデータセットから既存のユーザーを選択することで開始されます。これにより、関連付けられているすべての医療レコードが整理されたインターフェースに表示される診断ドキュメントの概要ページにリダイレクトされます。セキュリティ上の理由から、デモでは新しいドキュメントまたはクライアントの追加が制限されていますが、これらの機能は、システムセットアップ中に以下の構成手順で有効化できます。

クライアントの概要ページから、診断担当者は、その診断レコードにすでに関連付けられている既存の医療ドキュメントを確認できます。このステージでは、ドキュメントは処理またはエンティティ抽出なしにMongoDBに保存される未加工ファイルとして存在します。完全な本番システムでは、チームは直感的なドラッグとドロップ機能を使用して新しいドキュメントをアップロードし、 PDF、医療画像、テキストファイル、XML ドキュメントなどの任意の形式を受け入れます。

図の 1。クライアントのドキュメントの概要

ドキュメントを処理する前に、診断担当者はインターフェースの右上セクションにあるメニューからテンプレート構成にアクセスし、抽出要件をカスタマイズできます。この構成パネルにより、医療チームは、 AIツールが抽出するエンティティタイプ、処理ルール、および出力形式を正確に定義できます。このシステムには、ユーザー統計、診断、診断、特権などの医療エンティティの包括的なライブラリが付属しています。チームは、自分の特殊性に関連するエンティティのみを選択または作成できます。例、オンロールのチームは、カーディナリティやトラフィックのチームとは異なる抽出パラメーターを設定することができ、システムが特定の要件に適応していることを確認します。

図の 2。テンプレート定義プロセス

テンプレートがすでに構成されているため、診断担当者は、分析したいクライアントドキュメントバンドルごとにドキュメント処理を手動でトリガーできます。このアクションにより、ドキュメントがドキュメントプロセッサに入力されるエンティティ抽出フェーズが開始されます。ドキュメントプロセッサは OCR を使用して、画像やスキャンされたデータからテキストを抽出します。システムは形式の不整合を正規化し、この実装ではAWS Red などの LM プロバイダーを介してコンテンツをインテリジェント分析用に準備します。 AI は事前構成されたテンプレートの仕様に従ってエンティティを抽出し、これらが抽出されたエンティティはソースドキュメントにリンクされたMongoDBに保存されます。

ドキュメントが処理され、エンティティが抽出されると、医療提供者は MMD レポートを生成できます。 MDM レポートジェネレーターは、インターフェースのレポートセクションで別の関数として動作します。ジェネレーターは新しいエンティティ抽出を実行するのではなく、ドキュメント処理フェーズ中に以前に抽出され保存されたエンティティを集計して整理します。システムは、選択されたユーザーの複数の処理されたドキュメントのエンティティを組み合わせ、テンプレートの形式ルールを適用して、データを時系列で整理します。

図の 3。 MDM レポートビューア

MDN レポートが生成されれば、フィールドチームは観察可能性セクションで比較するために、提供されたground Truth データを使用してAIパフォーマンスを検証できます。この評価機能により、医療関係者は検証済みエンティティの抽出を参照標準としてアップロードし、 AIが生成した MTT レポートと比較できます。この評価プロセスにより、チームは AI のパフォーマンス特性を理解し、特定の医療コンテキストで最適な結果が得られるようにテンプレート構成を調整するのに役立ちます。

このワークフロー全体の分離を通じて、 MongoDB は各コンポーネントの高速取得を可能にしながら、未加工のドキュメント、処理されたエンティティ、および生成されたレポート間で明確に維持します。

最後に、ユーザードキュメントから抽出された診断インサイトとAIシステム自体のパフォーマンスメトリクスの両方を包括的に理解することで、このジャーナルは終了します。このアプローチにより、チームは価値の高い MDP レポートを受け取るだけでなく、この MDP 生成の背後にあるAI処理の信頼性と精度にも信頼できるようになります。

図の 4。 AIベースのメトリクスレポートジェネレーターのアーキテクチャ図

クリティカルエンティティ抽出におけるAIのロール

AI駆動型エンティティ抽出プロセスは、非構造化医療ドキュメントを実行可能な診断データに変換する主要インテリジェンスを表します。高度な LRM は、テンプレートを使用した命令とドメイン固有の理解性を組み合わせた高度なマルチステッププロセス（図 5 で説明されている）に続いて、プライマリ抽出エンジンとしてクラウドベースのAIサービスを通じて動作します。

図の 5。 AIワークフロー図

抽出プロセスは、処理されたドキュメントが Entity Extractor コンポーネントに到達したときに開始されます。ここで、LVM モデルは構成可能なテンプレートを通じて特定の指示を受け取ります。図 5 で説明されているように、これらのテンプレートは、特殊な処理ロジックを適用しながら、関連する医療概念に LM の注意を向ける詳細なプロンプトエンジニアリングとして機能します。

テンプレートで指定された各エンティティ定義は、正確な抽出パラメータを持つ LM を提供します。例、診断日付エンティティは、インストール日や診断開始日と区別して、 biopsy の診断日を検索するようモデルに指示します。 LVM は、正確な識別を確保するために、ドキュメントの種類、期待される形式、および診断上の重要性に関するコンテキストを受け取り、利用可能なドキュメントを処理するときにそのコンテキストと制約を適用します。

テンプレートシステムには、LDM の抽出動作をガイド3 つの異なる処理タイプが実装されています。

一致処理: このメソッドは、ユーザーデータベースのような確実なエンティティの初期の信頼インスタンスを抽出するようにモデルに指示します。
集計処理: 選択すると、ドロップ履歴などの蓄積情報のすべてのノードを収集するように LM に指示し、インテリジェントな重複重複除外ロジックを適用します。
ソースフィルタリングされた処理: 有効にすると、特定のエンティティを抽出するときに特定のドキュメントタイプを優先するようにモデルをガイドします。

テンプレート定義ステップが完了し、新しいテンプレートが選択されると、LVM プロンプトフェーズが開始されます（図 2 を参照）。プラットフォームは、医療エンティティを抽出する高度なクエリを構築します。各クエリは、簡潔なシステムプロンプトで始まる標準化された構造に従います。

ドキュメントから関連データを抽出する名人です。以下を行う必要があります。

このシステムレベルの指示は、特定の抽出タスクを提示する前に、LM のロールと専門知識のコンテキストを確立します。最後のクエリは、構造化された XML タグ内にドキュメントコンテンツとエンティティ仕様をカプセル化します。ドキュメントセクションには処理された医療テキストが含まれ、エンティティセクションには、各ターゲットエンティティに対する詳細な抽出手順が提供されます。このアプローチにより、LDM は明確で構造化されたディレクティブを受け取るようになります。

モデルによって生成された抽出されたエンティティは、最終製品（MDT レポート）を作成するためのインテリジェントな医療合成を可能にする構造化データになります。モデルのコンテキストに応じた理解により、抽出された概念間の論理的な関係が維持され、プラットフォームは以前に非構造化されていた医療情報から構造化された出力を構築できます。

この LVM を使用したアプローチでは、高度な言語モデルが、ドメイン固有のテンプレートとソースを認識する処理ロジックで適切にガイドされる場合、医療環境で効果的なツールとしてどのように機能するかが示されています。

その結果、このソリューションにより、医療チームは、数千の医療ドキュメントから意味を抽出する従来のプロセスを、医療の専門知識を強化する自動プロセスに変換することができます。

ソリューションのビルド

README詳細な設定手順については、OpSampleRate ソリューション GitHubリポジトリのに記載されている手順に従ってください。このリポジトリは、 AI駆動型メトリクスレポートジェネレーターのデモ用にバックエンドとフロントエンドをホストします。

このデモを自分の環境で再現するには、次の手順に従います。

MongoDB を Atlas またはローカルでセットアップ

MongoDB Atlasポータルにログインし、データを保存するための任意の名前でデータベースを作成します。

次の手順のために接続文字列を保存します。

IPアドレスが Atlas 配置のアクセスリストに追加されていることを確認します。

Githubリポジトリのクローン

次のコマンドを使用して、リポジトリを希望の場所にクローンします。

git clone https://github.com/mongodb-industry-solutions/hc-mdt-report-generator.git
cd hc-mdt-report-generator

AWS Reduce アクセスの有効化

AWS Reduce アクセスの認証情報を設定します。

AWS CLI を構成するか、Cloud モデルにアクセスするための Bearer 権限を持つ IAM3 ロールを作成します。 SSO ログインを使用する場合は、次のコマンドを実行してこの接続を構成できます。
```
aws sso login
```
指示に従ってログます。
終了したらブラウザを閉じ、次の手順に進みます。

環境変数を設定する

./generate_env.shファイルを使用してテンプレート構成を生成します。

生成された .envファイルを特定の構成で更新します。

MONGODB_URI=mongodb+srv://<user>:<password>@<cluster-url>/?retryWrites=true&w=majority
MONGODB_DB=your_database_name
AWS_REGION=us-east-1
AWS_ACCESS_KEY_ID=your_access_key (if used)
AWS_SECRET_ACCESS_KEY=your_secret_key (if used)
SECRET_KEY=your_secure_secret_key
LLM_PROVIDER=bedrock

依存関係のインストール

バックエンドとフロントエンドに必要な依存関係をすべてインストールするには、 Makefile を使用します。

ルートディレクトリを参照し、次のコマンドを実行して依存関係をインストールします。

make install

サンプルデータを使用してデータベースを初期化

次のコマンドを実行中て、サンプルデータドキュメントとエンティティ定義をロードします。

python scripts/bulk_data_ingestion.py
python scripts/add_template_to_mongodb.py

成功するファイルを使用して両方のサービスを配置

2 つの異なるターミナルで、次のコマンドを実行してサービスを個別に開始します。

ターミナル 1: バックエンド

make backend

ターミナル 2: フロントエンド

make frontend

これらの手順を完了したら、完全に機能するAI駆動型メトリクス支援を使用できるようになります。次の URL ですべてのリソースが見つかります。

フロントエンド: http://localhost:3000
API docs: http://localhost:8000/docs
ヘルスチェック： http://localhost:8000/health

キーポイント

データ抽出を自動化し、手動エラーを削減します: PDF、スキャン、無料テキストレポートから情報を手動で抽出するには、診断局に依存するとプロセスの効率が低下し、人間によるエラーが増加します。ユーザ履歴のサイズが大きく複雑になるにつれて、手動によるアプローチを維持すると、レコード間で不整合が発生し、医療上の決定が遅くなります。
AIを使用して診断チームを強化 : このコンテキストでのAIの値は独立した決定ではなく、非構造化データから構造化医療エンティティを迅速かつ一貫して抽出します。このAI駆動型ソリューションは、複数のドキュメントからの診断データを処理し、インサイトあるレポートを作成することで、決定ワークフローを変更せずにドキュメントの問題を管理するのに役立ちます。
テンプレートを使用して医療エンティティの抽出をカスタマイズします。データ要件によって、データ要件が異なります。オン件名、カード名、外文字のチームは、オブジェクトドキュメントで同じシグナルを検索することはありません。このテンプレートベースのエンティティ抽出により、 AIシステムはさまざまな医療状況に調整できるようになり、出力が関連性があり、使用可能で、それぞれの特殊なニーズに一致していることが保証されます。
の出所と監査可能性を維持する: MongoDB は、テンプレートバージョンやの出所を含む完全な抽出コンテキストを保持し、抽出された各ファクトをそのソースに追跡できるようにします。

作成者

パトリシア・レナート・カルニセロ、MongoDB
Francesc Mateu Amengual, MongoDB
ユーザーの認証をサポートするためにMongoDB を使用しています

詳細

戻る

AI を活用した医療

Hybrid FHIR ODL