文書読解AIソリューション「LITRON™」を開発、再生医療分野の実験結果予測で効果を確認 ~業界固有の表現や専門用語を効率的に読解可能~

サービスインフォメーション

2020年9月10日

株式会社NTTデータ

株式会社NTTデータ(以下、NTTデータ)は、テキストデータから知識を抽出する文書読解AIソリューション「LITRON™」(読み:リトロン・特許出願中)を開発し、再生医療分野におけるiPS細胞等を用いた実験結果予測の検証において効果を確認しました。
LITRONは、専門家と対話する形で文書の読解方法を学習する仕組みを持ち、学習効率のよい質問をAIが生成する技術により、既存技術に比べて導入のための作業量を削減できます。業界固有の表現や専門用語を従来手法よりもすばやく学習できるため、さまざまなビジネスシーンへの適用が可能です。
LITRONの導入により、膨大な量の文書(ニュース・法律文書・学術論文等)から構造化された知識注1を自動的に抽出できるようになります。構造化された知識は、予測や分類などさまざまな分析に活用することも可能です。
現在NTTデータでは、LITRONを用いて再生医療分野の実験結果予測や、薬剤の飲み合わせリスク予測の取り組みを実施しています。今後、ヘルスケア業界に限らず、金融・製造業などの幅広い業界へLITRONを提供することを目指します。

背景

数多くの企業は業務において、報告書や申請書類、法律文書など、大量のテキストを扱っています。そのため、テキストデータは業務のあらゆる状況をリアルタイムに反映したデータであり、その分析から多くの有効な情報を抽出できると考えられます。
近年の研究の進展により、技術的にはテキストの分析は可能になっています。しかし、ビジネス文書には業界固有の表現や専門用語が頻出するため、ビジネスシーンでテキストの分析を行おうとすると、その業界に対応させるために非常に多くの時間と労力が必要という課題がありました。
そこでNTTデータは、少ない作業量でビジネス適用が可能な文書読解AIソリューション「LITRON」を開発し、2018年よりiPSポータル社と進めてきた再生医療分野の取り組み注2のなかで検証を行いました。

LITRONの特長

文書読解AIソリューションLITRONの特長は以下の通りです。

  • 業界固有表現の網羅的洗い出しや、膨大な量の業界文書の事前学習などを必要とせず、
    専門家との対話を通じてAIの学習を進められる仕組み(特許出願中)を持ちます。
  • 学習した文書読解AIにより、非構造テキストから構造化された知識を抽出することができます。
  • 構造化された知識を用いて、予測や分類などさまざまな分析が可能です。

上記特長により、再生医療分野に限らず、どのような業界にも適用可能です。

<LITRONの適用分野の例>

  • 金融・保険業等における書類審査の簡素化
  • 製造・小売業等におけるマニュアル類の構造化
  • マーケティングにおけるSNSなどのWebデータの分析・インサイトの抽出
  • メール・日報等の業務報告書からのリスク検知
  • 採用・人材派遣におけるエントリーシート分析
  • 法律・会計書類の誤り・不正の検知
  • 学術論文や特許文書からの情報抽出・体系化

図1:従来手法とLITRONの差異イメージ

図1:従来手法とLITRONの差異イメージ

再生医療分野への適用について

再生医療分野の細胞分化・製造実験において、LITRONで論文を読解し、構造化された実験情報を抽出することで、従来は不可能だった実験結果予測が可能となることが示されました。

図2:LITRONによる実験結果予測のイメージ

図2:LITRONによる実験結果予測のイメージ

再生医療とは、人工多能性幹細胞(iPS細胞)などを用いて、病気やけがで失われた身体の一部を再生し、その機能の回復を目指す医療です。従来は治療が難しかった疾患に対して新たな治療法をもたらす可能性がある分野として、近年、研究が進んでいます。
再生医療分野では、iPS細胞などの未分化細胞から所望の細胞を得る方法が、実験を通じて日々探索されており、この過程を通じて確立した方法によって、目的に見合う量・安全性・質を担保した分化細胞の製造を目指しています。多くの方法では実験に一定の時間を要するため、効率よく進めることが非常に重要ですが、再生医療分野の実験は十分な品質を持った細胞の作製成功率にばらつきが存在し、研究の不均一化や高コスト化を招いていました。
無駄な実験を削減しつつ、精度の高い実験を達成するためには、過去の論文を参照し、実験結果を予測して実験設定を最適化することが望まれます。しかし、再生医療分野では数万件の論文が出されており、全てに目を通して実験結果予測モデルを構築することが難しい状況にありました。
そこで今回、LITRONを用いて論文に記載された過去の実験情報を抽出・構造化することで再生医療分野における実験結果予測モデルの構築を可能にしました。
今後、予測結果に基づく実験設定の最適化を通じて、研究や細胞製造における効率化や精度向上に寄与することが期待されます。現在は予測モデルのさらなる精度向上を目指して活動を継続しています。

今後について

今後、NTTデータはヘルスケア業界に限らず、金融・製造業など幅広い業界へLITRONを提供し、お客さまのAI活用を支援します。

注釈

  • 注1構造化された知識とは、表のような形にまとめられた知識のことです。
    例えば、医者の書いたカルテを対象の文書としたとき、構造化された知識は「患者名/各症状の有無/体温等がまとめられた表」を指します。
  • 注22018年11月21日ニュースリリース:iPSポータル社との資本業務提携について
    https://www.nttdata.com/jp/ja/news/release/2018/112101/
  • 「LITRON」は日本国内における株式会社NTTデータの商標です。
  • その他の商品名、会社名、団体名は、各社の商標または登録商標です。

本件に関するお問い合わせ先

株式会社NTTデータ
ビジネスソリューション事業本部
AI&IoT事業部
加藤
TEL:050-5546-2297
E-mail:contact.litron@kits.nttdata.co.jp