生命科学文献からのデータ作成をAIでアシスト

自然言語処理・理解モジュール

研究のポイント

科学論文数は膨大で、酵素反応や細胞内シグナル伝達パスウェイ等の生命科学系データベース(DB)では、データ作成(キュレーション)の質と速さがキュレータの専門知識や英語力に依存する。こうした依存を軽減するには、優れたテキストマイニング・システムで、キュレータの作業を支援する必要がある。そこで、生命科学系DB構築支援技術として、テキストマイニング技術を発展させ、文献テキストデータから酵素反応や蛋白質間相互作用といった生命現象(生命系イベント)などの情報を構造化して適切に抽出(イベント抽出)するシステムを開発する。

キーワード:
  • テキストマイニング
  • 科学文献キュレーション
  • イベント抽出

モジュール・データの概要

テキストマイニング・システム

  • 深層学習による高精度なイベント抽出システムの開発
  • 外部知識、文・文書間の情報を利用したイベント抽出システムの開発
生命系科学文献キュレーション支援用テキストマイニング・システム

想定されるアプリケーション

大量文献からのイベント抽出による生命系データベースの拡充
研究開発プロジェクト NEDO 次世代人工知能・ロボット中核技術開発の成果
研究機関 国立研究開発法人 産業技術総合研究所
主要研究者 長野 希美、池田 修己(産業技術総合研究所)、三輪 誠(産業技術総合研究所、豊田工業大学)