DataRobotでヘルスケア分野のお客様を担当しているデータサイエンティストの伊地知です。本稿では、まず日本の医療業界の現状と課題を総括し、次にDataRobotユースケースを中心に医療分野での機械学習活用事例をご紹介します。
日本の医療業界:現状と課題
製薬業界での事例をご紹介した弊社菅原のブログ記事でも言及されていますが、日本は世界で最も少子高齢化が進んでおり、そのため「医療/社会保障分野の課題先進国」と言われています。具体的には以下3つの課題があります。
日本社会は世界に類を見ない速度で少子高齢化が進んでいます。(厚生労働省が出した予測[1]では、現在よりもやや出生率が高くなったとしても、2100年に日本の総人口はピークとなった2008年の約半分になるとされています)
出典:https://www.mhlw.go.jp/wp/hakusyo/kousei/15/backdata/01-00-01-001.html より
高齢化率の増加とともに医療や年金、福祉などにかかる社会保障給付費も増加しています。厚生労働省によれば、2000年に78.3兆円だった社会保障給付費は、2015年に118.3兆円に増え、わずか15年で約1.5倍になりました。そして社会保障給付費の約35%が医療費で占められています。
日本人の死亡原因は、昔は肺炎や結核などの感染症が主流でしたが、現在は悪性新生物(がん)、心疾患、脳血管疾患が3大疾患となっています。2015年の国民医療費は42.3兆円(うち医薬品が9兆7000億円)で、巨大市場と言うことができます。
2025年には「団塊の世代」に該当する人の多くが75歳以上になり、今のままでは医療費・介護費の急増や医師など医療専門家の深刻な不足が起こると予想されています(2025年問題)。そのため、日本政府は地域包括ケアシステム[2]など「2025年に向けた医療提供体制の改革」を急ピッチで進めています。
出典:https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/hukushi_kaigo/kaigo_koureisha/chiiki-houkatsu/ より
実際に、2020年度の診療報酬改定では全体で0.46%のマイナスとなる方針が出ています。ただしマイナスとなるのは薬価部分で、本体部分は0.55%のプラスとして特に病院向けに手厚く設計されます。(例えば、救急病院勤務医の働き方改革には本体部分0.55%のうち0.08%を充てるなど)
また、地域医療構想を進めるため、病床のダウンサイジングへの支援を大幅に強化し、2020年度に限った措置として国の予算で84億円を計上し、病床を減らす医療機関に対しては補助金を国から拠出する方針も定められました。
医療業界の課題と機械学習
前章で日本の医療業界の課題を総括しましたが、突き詰めれば以下2つの結果に繋がる活動をどれだけ実行できるかが重要になってきます。
- 医療費の削減[3]:
- 多大な医療費がかかる重篤疾患にかかる患者数の減少(例:糖尿病の重症化予防など)
- 3大疾患の予防手法や治療手法の開発
- 平均在院日数の短縮
- 特定健診・保健指導の推進
- 後発医薬品の使用促進
- 医薬品の適正使用推進 など
- 医療サービスの生産性向上
- 月間新規患者数・手術件数などの改善
- 病床稼働率の向上
- ICTの活用による診療業務の効率化
- 医療スタッフの合理的なタスクシフト
- 医療機器などの稼働率向上と適正なメンテナンス など
上記活動を推進するために、病院などの医療機関はレセプトデータや臨床データを利活用したい意向があります。従来それらのデータはBIツールで可視化されたり多変量解析などの統計解析によって分析されてきましたが、近年は傾向スコアマッチングなどの因果推論手法やベイジアンネットワークなどの新しい統計モデリング手法、さらに2015年ごろからは機械学習を使った分析事例も、例えば人工知能学会・医療情報学会等の会誌や研究会[4]で発表されるようになってきました。弊社でも「データ解析を機械学習で行えないか」とのご相談を医療従事者・研究者からいただく機会が増えています。
このように医療業界でも機械学習が注目されている理由は、次のように考えられます。
- 「レセプト情報・特定健診等情報データベース(NDB)」のような医療ビッグデータ整備環境が改善されてきた
- 機械学習は数値データ、カテゴリデータ、テキストデータ、画像データ、時系列データ、など様々な素性のデータを包括的に扱える
- 機械学習はリアルワールドデータが持つ弱点(対照データが足りない、欠測がある、不規則に取られている、など)に対処しながらインサイトを得られる可能性がある
病院・医療系研究機関での機械学習活用事例:臨床関連
医療サービス提供プロセスを大きく「予防・先制医療」「診察・検査」「治療」「入院・退院」の4ステップに分類すると、機械学習を適用できる可能性のあるテーマを下図のように定義できます。
- 予防・先制医療:発病予測、患者別薬効予測、医療費予測、など
- 診察・検査:診断の補助・自動化、画像診断支援、など
- 治療:治療方針決定支援、治療後の予後予測、など
- 入院・退院:入院患者数予測、院内感染予測、退院後の予後予測、など
それでは、病院や医療系研究機関(大学の医学研究科など)で実際に機械学習がどのように使われているのかを、国内DataRobotユーザー様の事例も含めていくつかご紹介します。
予防・先制医療事例
抗体医薬品によるがんの治療は、がんの種類によっては奏功する確率が20%程度のケースもあるのが現状です。そのため、投与前に本当に効果が期待できるかどうかを患者さんごとに高い精度で判別できれば、より有効な治療方針の検討に役立つとともに、将来の治療効果の改善にも繋がるはずです。
京都大学 本庶佑 高等研究院副院長・特別教授、茶本健司 医学研究科特定准教授、波多江龍亮 同研究員(現・九州大学助教)らの研究グループは、肺がん患者の血中免疫細胞のエネルギー代謝状態や血漿中の代謝産物に注目し、PD-1阻害抗体が患者さんに奏功するかどうかを判別するモデルの作成にDataRobotを使用して、以下の結果を得ました。(この成果を含む研究成果全体は論文[5]を参照)
- 薬が効く患者さんと効かない患者さんを高精度に判別できることがわかった
- 判別に重要なバイオマーカーを絞り込むことができたので、今後、検査するバイオマーカーを減らすことで、より簡便で侵襲性の少ない検査を以て臨床プロセスで薬効予測を行える可能性が示された
健診データを利用した将来の疾患発症予測
糖尿病などの生活習慣病は、発症してからでは治療や投薬に多大な医療費がかかります。そのため、個人の過去の健康診断結果から将来の重篤疾患発症リスクを予測できれば、その人に対して未病状態のうちから介入してQOLを向上させられる可能性があると共に、医療費抑制にも貢献できると考えられます。ある国内医療機関の研究チームは過去数年分・数千項目に及ぶ、健康診断時に取られたバイオマーカーや問診結果のデータ(差分特徴量も追加)を用いて、特定の個人が数年以内にある疾患(糖尿病、慢性腎臓病、認知症、動脈硬化、など)を発症するリスクを予測するモデル作成にDataRobotを使用し、以下の結果を得ました。(AUCは予測モデルの精度評価指標の一つで、1に近ければ近いほど精度が良いことを示しています)
- 糖尿病ではAUC=0.9台の予測モデルが作成された
- 慢性腎臓病、認知症、動脈硬化などではAUC=0.8台の予測モデルが作成された
- 予測のために特に有用な特徴量が疾患毎に分かった
診察・検査事例
海外渡航帰国者の感染症罹患判別
マラリアやデング熱などの熱帯感染症は、専門家によるケアが必要です。一方、海外渡航から帰国後直ちに国内病院で診療を受けた場合に熱帯感染症に詳しいドクターに診断していただける可能性はとても低いと言わざるを得ません。そのため、例えば市中の病院でもAIの助けを得て適切に海外渡航帰国者の熱帯感染症罹患リスクを判別できれば、患者さんが重篤な状態に陥る前に治療介入できる可能性が高まります。
ある国内医療機関の研究チームは、渡航先、患者プロファイル、様々なバイオマーカーなどを特徴量にして熱帯感染症に罹患しているかどうかを判別するモデル作成にDataRobotを使用し、以下の結果を得ました。
- 海外渡航から帰国直後に病院を訪れた人が感染症(マラリア等)に罹患しているリスクを高い精度で判別するモデルが作成された
- モデルが出した情報を活用して医師が効果的にトリアージを行える可能性が示された
治療事例
ICUで治療中の患者に対する重要イベント予測
ICU(集中治療室)で治療を受けている患者さんに重要イベント(内出血など)が発生すると非常に危険です。そこで実際にイベントが発生するより前に発生リスクを予測し、必要あれば事前に介入できるようになれば、病院にとってはリスク管理のレベルを上げられます。
Michigan Center for Integrative Research in Critical Careでは、ICUで稼働する機器から送られてくるパルスオキシメーター値や血圧、体温などのバイオマーカーを特徴量として、患者さんに内出血など治療を必要とする重要イベントが発生するかどうかを予測するモデルを作成し、以下の結果を得ました。
- 患者さん個人単位で内出血などの重要な治療イベントが発生するかどうかを予測できるようになった
- 予測結果(患者さん毎の重要イベント発生リスク確率)を使って、内出血などの重要イベントが発生しないよう事前に介入計画を立てられるようになった
がん患者の予後予測
がん患者さんの闘病中のQOLを向上するためには、患者さん個人の状態に合わせたサポートが必要です。そのため予後予測は非常に重要な研究テーマとなっています。
ある国内医療機関の研究チームは数十のバイオマーカーからあるがんの患者さんの3ヶ月後死亡リスクを予測するモデル作成にDataRobotを使用し、以下の結果を得ました。
- 3ヶ月以内の死亡リスクを高精度に予測できるとわかった
- 予測のために重要なバイオマーカーを絞り込むことができた
- 機械学習で得られたインサイトをもとに、より正確な生存時間の予測や、より効率的な指標を作る可能性が示された
入院・退院事例
退院する患者さんの予後予測
ある患者さんが退院後間も無く感染症罹患や転倒を起こすリスクをその患者さんが入院中から予測できれば、合併症予防のために役立てられます。
Symphony Post Acute Careでは、患者さんのプロファイルデータや、診療科、診察した医師、薬の投与記録、問診記録、などのオペレーションデータを元に、その患者さんに退院後すぐ感染症罹患や転倒などのイベントが発生するかどうかを予測するモデルを作成し、以下の結果を得ました。
- 患者さん個別に退院後の感染症罹患や転倒のリスクを予測できるようになった
- 予測結果に基づいて、合併症を予防するための介入を事前に行えるようになった
病院での機械学習活用事例:病院経営関連
前章までは患者さんとの直接のタッチポイントがある、医療サービス提供プロセスでの機械学習適用事例をご紹介しました。一方、バックオフィス系の業務プロセスに機械学習で作成した予測モデルを実装して病院全体のオペレーションの効率化やコスト削減を目指す活動が、大規模病院や病院グループを中心に医療業界でも見られるようになってきました。弊社でも米国の医療機関での事例がありますので、それらを含めてご紹介します。
ICU(集中治療室)やER(救急治療室)に移送される患者の予測
特に専門訓練を受けたケアスタッフを必要とするICUやERに移送される可能性の高い患者さんを個別に予測できれば、流通小売業界での需要予測事例と同様に、適正な人員配置など、院内オペレーションの効率化に役立てることができます。
ある米国の病院では、入院患者さんのプロファイルデータやバイオマーカー系データ、措置履歴データ等を元に、その患者さんがICUあるいはERに移送されるかどうかを予測するモデルを作成し、以下の結果を得ました。
- 移送される可能性の高い患者さんを予測できるようになり、ICU/ER側で前もって受入れ準備が行えるようになった
- ベッド数の適正化や人的リソースの効率的な運用ができるようになった
消耗品使用量の予測
病院では様々な消耗品が日々使用されています。これも流通小売業界での事例と同様に、院内で使用される消耗品の今後の使用量を予測できれば、使用効率の最適化に役立てることができます。
ある米国の病院では、過去の使用実績(日単位)や、過去の院内オペレーション関連データを元にある消耗品の将来の使用量(日単位)を予測するモデルを作成し、以下の結果を得ました。
- 日単位で、今後の消耗品使用量を予測できるようになった
- 予測結果に基づいて発注タイミングなどを最適化した結果、消耗品の使用効率が上がり、調達コストを削減できた
まとめ
以上、医療業界での機械学習利用事例をご紹介してきました。これらの事例と筆者自身が医療業界のDataRobotユーザー様をご支援してきた経験から感じていることを以下にまとめます。
- 従来の多変量解析手法だけでは分析が困難だった形態の臨床データにも機械学習を適用できるケースが多い(より詳しくは弊社ブログ記事[6][7]を参照)
- 必ずしもデータサイエンスが本業では無い医療従事者の方でも、自らDataRobotを用いて短期間に様々な仮説を次々と検証できるようになった(弊社では「高速PDCAの実現」と呼んでいます)
- DataRobotで作成した機械学習モデルから病態機序や薬の作用機序解明を助ける新規知見を得られた
- AIアプリケーションを業務プロセスに実装して運用するフェーズまでの具体的な検討を早期に始められるようになった
弊社は今後も、国内の医療機関で働く医師や研究者が自らの手で効率良く予測精度の高い機械学習モデルを開発するためのプラットフォームをご提供し、医療機関でのAI推進活動を強くご支援してまいります。
参考文献
[1] 平成27年版厚生労働白書(2015):「長期的な我が国の人口推移」, https://www.mhlw.go.jp/wp/hakusyo/kousei/15/backdata/01-00-01-001.html
[2] 厚生労働省:「地域包括ケアシステムの実現に向けて」, https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/hukushi_kaigo/kaigo_koureisha/chiiki-houkatsu/
[3] 厚生労働省:「第三期医療費適正化計画(2018~2023年度)について」, https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000190705.html
[4] 日本医療情報学会「医用人工知能研究会」・人工知能学会「医用人工知能研究会 (SIG-AIMED)」合同研究会:https://sites.google.com/site/jamijsaiaim/home
[5] Ryusuke Hatae, Kenji Chamoto, Young Hak Kim, Kazuhiro Sonomura, Kei Taneishi, Shuji Kawaguchi, Hironori Yoshida, Hiroaki Ozasa, Yuichi Sakamori, Maryam Akrami, Sidonia Fagarasan, Izuru Masuda, Yasushi Okuno, Fumihiko Matsuda, Toyohiro Hirai, and Tasuku Honjo. (2020). Combination of host immune metabolic biomarkers for the PD-1 blockade cancer immunotherapy. JCI Insight, 5(2):e133501. https://doi.org/10.1172/jci.insight.133501
[6] DataRobotブログ(2020):「統計解析と機械学習:要因分析からの考察 Part 1」, https://www.datarobot.com/jp/blog/statistical_analysis_ml_part_1/
[7] DataRobotブログ(2020):「統計解析と機械学習:要因分析からの考察 Part 2」, https://www.datarobot.com/jp/blog/statistical_analysis_ml_part_2/
オンデマンドビデオ
AI Experience Virtual Conference 2021
「DataRobot AI Cloud」に関する基調講演や、業界をリードするDX推進企業の取り組み、AIサクセスを実現するビジネスリーダーによるパネルセッションをオンデマンドビデオで確認
オンデマンドで見る