人工知能が我々の生活の中に入って育児や介護などを支援できるようになるためには、日常生活の様々な出来事を深く理解している必要がある。本研究ではカメラなどで視覚的に観測された日常シーンにおける人の行動を認識し言語へと変換する技術を開発する。「誰が(誰と)何をしている」など動作主、動作内容、動作対象などをきめ細かく認識する技術を開発する。さらに、映像と言語を統合した長期記憶機構を開発し、過去の出来事について数日まで遡って質問に答えることができるような質問応答機構を実現することを目指す。
参考 | Kinetics | 400種 x 750本 |
---|---|---|
ActivityNet | 203種 x 137本 |
研究開発プロジェクト | NEDO 次世代人工知能・ロボット中核技術開発の成果 |
研究機関 | 学校法人 千葉工業大学(千葉県習志野市)[ 産総研からの再委託 ] |
主要研究者 | 竹内 彰一(千葉工業大学) |