1人称ビデオからのキーフレーム抽出(行列式基準版)

認識・モデル化・予測モジュール

研究のポイント

  • 1人称ビデオからシーンの変わり目など重要な情報を含むキーフレームを抽出
  • 行列式基準を用いたスパースコーディング手法を応用
  • DC 計画法による高速な最適化

モジュール・データの概要

カメラデバイスが軽量、安価になることに伴い、実世界で自分の頭部などに装着したビデオカメラから得られる1人称のビデオ信号の収集と利用への期待が高まっている。​
日常生活の中で撮られた1人称ビデオの信号は冗長であり、不要なシーンが多く含まれているため、重要な情報を含むキーフレームの抽出へのニーズが高い。​
そこで、行列式基準のスパースコーディング手法によって用いたキーフレームを抽出する方法を開発し、モジュール化した。Difference of Convex (DC) 計画法を用いることで、エッジデバイス上でも最適化を高速に実行可能という特徴を有する。

ソースコードを公開中
https://github.com/aistairc/SC_DET_based_keyframe_extraction

手法の詳細の論文
Yujie Li, Benying Tan, Shuxue Ding, Incheon Park, and Atsunori Kanemura, "Key frame extraction from video based on determinant-type of sparse measure and DC programming", IEEE International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC), pp. 174–180, September 2017 DOI: 10.1109/MCSoC.2017.8

想定されるアプリケーション

日常生活や作業中の1人称ビデオデータの情報圧縮、理解を通じた利活用​

研究開発プロジェクト NEDO 次世代人工知能・ロボット中核技術開発の成果
研究機関 国立研究開発法人 産業技術総合研究所
主要研究者 Yujie Li(産業技術総合研究所、現 桂林電子科技大)