電子カルテの非構造化データから、炎症性腸疾患者への投薬治療効果の判別を支援

~小野薬品工業と炎症性腸疾患に関する研究について学会発表~

トピックス

2023年11月24日

株式会社NTTデータ

株式会社NTTデータ(以下、NTTデータ)は、小野薬品工業株式会社(以下、小野薬品工業)が千年カルテデータベース(以下、千年カルテ注1)を用いて実施した炎症性腸疾患(以下、IBD)領域における研究を支援しました。この研究は、指定難病である炎症性腸疾患の患者さんに対する、治療実態の把握を通じて薬物が効きづらい人に見られる特徴を確認するものです。千年カルテの、非構造化データ(経過記録や臨床サマリー情報など)を含む電子カルテデータに対して自然言語処理を行い、医師の記載する文章中に、薬物が効きづらい人に共通して出現するキーワード(「改善+ない」、「絶食」、「疼痛」、「出血」、「増悪」、「痛み」、「発熱」)の存在を確認しました。本研究の一部の結果は第24回日本医療情報学会学術集会注2において発表しています。
この研究成果は、投薬中の症状から自動的に薬物治療抵抗性注3を判定することや、投薬の効果を図るデジタルバイオマーカー注4作成に向けた足掛かりになると考えています。今後、評価するデータ数を増やし、キーワードの組み合わせやAIの活用なども念頭に評価方法を精緻化させ、最終的には患者さんの負担を減らし、より効果的な治療の支援を目指していきます。

今回の研究を実施した背景

IBDは一般的に潰瘍性大腸炎、クローン病の2疾患を指した自己免疫疾患・指定難病です。その原因は解明されておらず、発症すると長期間の治療が必要とされています。近年では免疫系に作用する新薬が登場していますが、それらの薬剤に対し十分な効果を得られない、治療抵抗性を示す患者さんが少なくありません。そのため、既存の薬物治療で治療抵抗性を示す患者さんに対して、臨床情報から原因を特定し対応する治療薬の開発、提供が求められています。
昨今、実際の臨床における情報を得る手段として、リアルワールドデータ(以下、RWD)の活用が期待されています。RWDとは、保険請求データ、DPC注5調査データ、電子カルテデータなど、実際の医療を通じて生み出される医療情報を指すものです。これを用いて研究することによって、実際の医療における患者さんの困りごと、薬の効果や副作用などを探索することが可能になります。
しかし、日本国内において流通するRWDの多くは保険請求データなど、「どのような医療行為を行ったのか」という結果に関するデータであり、患者さんが「どのような状態を経て、その医療行為の結果どうなったのか」という治療過程についての把握は困難でした。今回用いた千年カルテには医師が日常診療で記載している経過記録などの自由記載テキストの情報を含む電子カルテのデータが含まれています。
今回両社は、この電子カルテデータの自由記載テキストに着目し、薬物治療抵抗性を示す患者さん特定の方法論開発を目的として、本研究を行いました。

図1:本研究のイメージ

図1:本研究のイメージ

本研究の概要

研究目的 IBD患者を対象。千年カルテを用いて、電子カルテデータなどの自由記載データを基に保険請求データでは明らかにできない薬物治療抵抗性などの臨床アウトカムを客観的に抽出する方法論を検討し、その精度評価を実施する。
研究期間 2023年3月~2023年7月
研究手法 千年カルテに登録されているIBD患者866名のうち、患者データの経過記録などから研究対象治療薬の投与履歴が確認された210名を対象に、薬物の治療抵抗性の有無について経過記録および臨床サマリー情報の自由記載データを目視確認し治療抵抗性有無に関する判定を行った。
経過記録および臨床サマリー情報の自由記載データに対し、類義語登録、態度表現(肯定・否定)の区別を行いながら自然言語処理技術を適用し、薬物治療抵抗性の判定に有用と思われるキーワードを特定した。その上で、薬物治療抵抗性判定に対するキーワードの精度を評価した。
役割

小野薬品工業:

  • 研究計画の立案、実施
  • 研究に利用するデータの特定
  • データ解析結果の評価

NTTデータ(LDIから受託)

  • 研究計画の立案、実施支援
  • 自由記載データの確認、自然言語処理、統計解析
  • 統計情報、匿名加工医療情報の提供
研究結果

抽出されたキーワードに対し、感度(そのキーワードが存在することで、薬物治療抵抗性を示した患者を正しく治療抵抗ありと判定できる割合)、特異度(そのキーワードが存在しないことで、薬物治療抵抗性を示さない患者を正しく治療抵抗なしと判定できる割合)の観点で分析を行った。「改善+ない」、「絶食」、「疼痛」、「出血」は他キーワードと比較して、感度と特異度の両方が相対的に高いことから、当該キーワードが存在すれば薬物治療抵抗性ありの確率が高く、当該キーワードが存在しなければ治療抵抗性なしの確率が高いと解釈できる。つまり、薬物治療抵抗性を特徴づけやすいと考えられ、キーワード候補として特定された。また、他の指標を用いた評価においては、「増悪」、「痛み」、「発熱」といったキーワードも他キーワードと比較して相対的に良い結果を示したため、治療抵抗性を特徴づけるキーワード候補として評価することができた。

  • 本研究における結果の一部について図2に示す。
図2:学会発表した結果の一部

図2:学会発表した結果の一部

今後について

今回発表した研究では、今後IBDの薬物治療抵抗性の判定方法を検討するにあたり、今後どのような手法をとるべきか、その方針を決定することに重点を置いていました。結果として、いくつかのキーワードで特徴的な感度、特異度の値を示したため、キーワードの出現頻度に着目した方法の有用性があると考えています。
今後、NTTデータは自然言語処理における評価精度向上のため、図2に記載したキーワード以外の表現の種類も拡充したうえで、キーワード同士の組み合わせにも着目し、方法論の精度を上げるための研究を検討していきます。BERT注6やGPT注7といった文脈理解を行う方法の適用についても、有用な選択肢になりうると考えています。これにより、最終的には自動的な治療抵抗性判定、デジタルバイオマーカー作成を目指すことで、医師の診断を支援し、より早く効率的に、適切な薬剤を患者さんに届けることを実現します。

NTTデータが描く製薬業界の未来

NTTデータは、業界・技術のForesight起点で未来を構想し、共創パートナーとしてお客さまの成長とビジネス変革を実現していきます。医療・ヘルスケア業界では、行政・民間企業などが一体となって、患者中心の医療の実現に取り組んでいます。NTTデータは、製薬企業の事業全体のデジタル化を支援し、医薬品開発のスピード向上と、ヘルスケア分野のサービス創出という領域拡大を同時に実現することを通じて、患者中心の医療体験変革に貢献していきます。
https://www.nttdata.com/jp/ja/industries/lifescience/

注釈

  • 注1 一般社団法人ライフデータイニシアティブ(認定匿名加工医療情報作成事業者、LDI)およびNTTデータ(認定医療情報等取扱受託事業者)が医療情報を、収集・匿名加工し提供。
  • 注2 医療情報学会は、医療情報に関心を持つすべての研究者および実務担当者の学術交流の場として、昭和58年(1983年)設立。(会員数:3,748名) https://www.jami.jp/
  • 注3 標準的な治療を行っても十分な効果が得られない、あるいは副作用によって治療が継続できないことを示す性質。
  • 注4 デジタルデバイスを通じて得られる、特定の疾病や症状との関連を示す印として機能するデータ
  • 注5 DPC(Diagnosis Procedure Combination)制度の導入の影響評価および今後のDPC制度の見直し(診断群分類ごとの点数の設定および診断群分類の見直しを含む)のために、DPC対象病院等から収集するデータ。
  • 注6 BERT(Bidirectional Encoder Representations from Transformers)とは2018年10月にGoogleが発表した自然言語処理モデルであり、自然言語処理分野のさまざまなベンチマークにおいて従来モデルの精度を上回るなど近年非常に注目されています。
  • 注7 GPT(Generative Pre-Training)とはOpenAIが開発している言語モデルであり、大規模なテキストデータを学習しています。高い精度であたかも人間が書いたような文章を生成してくれるものとして注目されています。領域に特化した学習を行うことで、インプットデータからそれをさまざまなカテゴリに分類することも可能です。

小野薬品工業株式会社について

小野薬品工業株式会社は、日本の大阪市に本社を置き、特定領域における革新的な医薬品の創製に取り組む研究開発型の製薬企業です。特に医療ニーズの高いがんや免疫疾患、中枢神経疾患およびスペシャリティ領域を創薬の重点研究領域として活動しています。

株式会社NTTデータについて

NTTデータは、豊かで調和のとれた社会づくりを目指し、世界50カ国以上でITサービスを提供しています。デジタル技術を活用したビジネス変革や社会課題の解決に向けて、お客さまとともに未来を見つめ、コンサルティングからシステムづくり、システムの運用に至るまで、さまざまなサービスを提供します。

本件に関するお問い合わせ先

株式会社NTTデータ
製薬・化学事業部
尾本、田中
E-mail:milkr_support@kits.nttdata.co.jp