眠ってる医局データを使えるようにするアプリ 2023/07/05
/ Jichi Med Univ(JAPAN)
本プロジェクトの目標 二次利用しづらい医療データの再活用
医療データに、理想的な整理やインデックス付けは不可能。
不完全・・・・・細かい記載のぶれや、間違いが多い。略語も多い。
時系列変化・・・診断は一つではないし、受診に応じて変化しうる
複数管理・・・・医療情報部、検査部、各医局、病理部、放射線部、など個々にサーバーを持ってることが大半
カード化リスク・マイナンバーなどでの一元管理は容易だが、リストが漏洩したときのダメージが大きい
かんたんな初期ライブラリのみで、自然言語処理を行い、
いろんな軸からデータを集められる・閲覧できる・評価できるアプリを作成します。
アプリの現状
医局での皮膚マクロ撮影写真(大量のHDDにはいってる)、病理診断結果、について、
匿名化処理したうえで、診察時所見・臨床診断・病理診断・治療内容、などについて
高速ビューできるアプリを作成。安価なラップトップでも高速動作を確認。
データからは個人情報は消失し、完全な独立した整理符号により管理(法順守)
注・画面内にでてくる名前は撮影スタッフなど医療側のものだけです
あらたな価値
ある「臨床診断」「病理診断」「症状」「治療・検査」をもとに該当症例のデータを一覧
診断難渋例がどのように診断されたか、あるいは、初期診断は病理診断と符号するか、など
典型例だけでなく、多用なケースを一覧できます。今までの教科書にはない新たな付加価値です。
リアルなデータをもとにインタラクティブな教科書が常に自動作成されています。
病理との連携
バーチャルスライド、病理レポート、マクロ撮影画像、記載テキスト(病歴)をリンク。
病名一覧リストを作らず、データを暗号・符号・分散処理するため、リスクを激減。
従来データの高速読み込み
病理からもらったスライドファイルについても、スライド記載されている
個人情報部分を削除し、別の符号により暗号処理します。
OCRによる番号読み取りを行い、手作業のコストを下げ、間違いを減らします。
使用感想
- 本をめくるようにパラパラにみられて、かつ写真はアトラス本の100倍?1000倍?以上。
- 症例を選ぶだけで臨床写真が時系列で見られ、かつ組織像(バーチャルスライド)とともに閲覧できる。
- 疾患名からも、病理診断名からも検索できる。
- ノートパソコン上で動かせるので、外来、病棟、医局と持ち運びやすい。
- 組織カンファ、医局員の教育、学会発表の準備、ケースシリーズ論文執筆などの効率がめちゃくちゃ上がりそう。
皮膚科医記載
初期目標 大学病院で診療科によくある問題。「放置されたデータたち」
大学病院で電算課・電子カルテ以外に、「診療科独自データ」をもつことはとても多い。
しかし、これらの独自データは、
手書きでの、入退院管理・病理標本などの台帳管理を秘書さんが行っている
サンプル・手術中などの撮影データがHDDにまとめて入っている
異動が多いため、担当医はいないことが多数。
データやサンプルの保管義務もあり、塩漬け多数。
ガラスやブロック標本はバーチャルにできたらなあ、とも。
のように理想的とはほど遠いことが多い。
とりあえず使えるかたちに自動でまとめたい!
着想 最小限の労力でデータをつかえるかたちにする
医者の手を使わずにデータを自動整頓したい。
電算課とは独立して行い、最後にデータマッチさせたい。
専門医申請、など、あとでデータが欲しいひともいる。
マイナー疾患でもしっかりあつまれば論文は書きやすい。
ただし!
よくあるAI詐欺提案はやらない。
画像から病気が自動診断みたいな夢は最初には語らない。
いまあるデータを使えるようにしてから考える。
着想 みたいデータを抜き出す
データは高速なビューアにかける。
みたい画像、みたい関心領域(ROI)をクリックすると、自動蒐集していく。
所見を医師がみたときは、フリーあるいは選択でコメントをいれておく。
ザーッと、専門医がながめるだけで、使えるデータをピックアップできる。
そのあとで、
画像に対して先端研究ができないか?
画像から何かいえないか?
他の臨床データとひもづけると?
のように研究を進めやすく。
example ある診療科のデータを使えるかたちにまとめるアプリをつくる
現状確認
大量のマクロ撮影データが一か所の医局ハードディスクにはいっている。
臨床データとのリンクはなく、二次利用しづらい。
EXIFにコメントがはいっているが、フォーマットが不定でそのままでは使えない。
1.EXIFフォーマット...
link to WIKI
...で患者情報が付加されている。
付加内容のフォーマットは一定しない。
患者ID、疾患名、患者名前が、スタッフによって手作業で台帳をみながら付与されている。
2. EXIFで自動で撮影機材・EV・露光時間が入れられている。フラッシュ動作は要確認。
3. おそらくEos40D + Macolens 50mmxF2.5ですべて撮影されてる
4. おそらく画素数は ラージ/ファイン 約3.5MB 3888x2592画素 in JPEGで統一されてる。
5. データはネットワーク隔離されたmacOS PCに入っている。
7. 画角・アングルはまちまち。部位についての記載はない。切り出し標本もあり。
体制確認
医療データ特有の難しさは最初に解決しておく。
要確認。
関係する人・企業・部署について、それぞれの対価を調整する必要あり。
外部企業とかかわるときは、成果物・知財について先方法務・当方研究支援と調整。
ソフトウェア開発については、成果物・知財について切り分けを明確に。
患者データについては、個人保護・暗号化したものもふくめ、一切外に出さない・持ち出さない。
電算課のポリシーを確認し、担当者にも可能なことをつめておく
Dummy data作成・Exif仕様確認
ダミーデータでセットアップしてから、本データを導入する。
作業
ダミーのコメントをいれたスタッフの写真を臨床部門で全く同様に撮影し、処理する。
いつものビューアーから、書き出し.JPEG (位置情報・付属情報をつける・最高画質)、TIFF(位置情報・付属情報をつける・最高画質)を行う。
カメラ仕様・レンズ収差の確認
撮影における不安定性を排除しする。
作業..時期未定
撮影機材を直接確認
格子撮影・カラーチャート撮影により収差確認。センサーの発色確認。
Make1 EXIF自動処理
現状データの書き出し。
現状データのEXIFを自動処理。個人情報の保護と暗号化(非公開鍵により可逆にする?)。
Make2 高速ビューアー
患者別、疾患別、時系列等、メイン情報でソートした高速ビューアー。
どこを見たかというログをすべて残し、同条件のなかでの画像について頻度ソートを行う。
臨床データについて一定のライブラリを自動?手動?生成。
似たようなプロファイル患者で一気にみられるなどのバリューを。
Make3 ROI設定
関心領域をドラッグさせ、記録。
今後の自動解析へ。
Make4 皮膚所見入力
Doctor Work1 ROI setting
関心領域をドラッグさせ、記録。
今後の自動解析へ。
Doctor Work2 皮膚所見入力
Doctor Work3 Error除外