知的メディア処理研究チーム

チーム概要

知的メディア処理研究チームでは、音響・音声、映像、テキスト、その他時系列センサー情報等、様々な「メディア」を統合的に認識・理解可能な技術の研究開発を行っています。実環境の様々なデータに対してこうした技術の研究開発・実証を行うことで、人間情報の解析だけでなく、産業機器・インフラも含めた幅広い分野の「支援」を目指します。

深山覚
チーム長

インフォメーション

2025.06.14

和田仰（技術研修生）が音学シンポジウム2025（第143回音楽情報科学・第156回音声言語情報処理合同研究発表会）学生優秀発表賞を受賞しました。

順序を考慮したオーディオエフェクトチェインの推定に対する双曲埋め込み：和田仰 (東京大学/産業技術総合研究所)、中村友彦 (産業技術総合研究所)、猿渡洋 (東京大学)

2025.06.14

滝沢力（リサーチアシスタント）が音学シンポジウム2025（第143回音楽情報科学・第156回音声言語情報処理合同研究発表会）優秀発表賞を受賞しました。

言語非依存な口真似による効果音合成手法PronounSEの評価：滝沢力 (京都産業大学/産業技術総合研究所),、平井重行 (京都産業大学)、金崎朝子 (東京科学大学)、須田仁志 (産業技術総合研究所)

2025.05.06

日刊工業新聞 2025年5月6日朝刊 3面に当チームの研究が掲載されました。 AI生成　スポーツ実況　音声基盤モデル×状況認識　NEDO・産総研　技術検証

続きはこちら

論文リスト

2025.12.06

Go Nishikawa*, Wataru Nakata*, Yuki Saito, Kanami Imamura, Hiroshi Saruwatari, and Tomohiko Nakamura, "Multi-sampling-frequency naturalness MOS prediction using self-supervised learning model with sampling-frequency-independent layer," in Proceedings of IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), Dec. 2025. (*: equal contribution)

2025.10.12

Ryan Niu, Shoichi Koyama, and Tomohiko Nakamura, "Head-related transfer function individualization using anthropometric features and spatially independent latent representations," in Proceedings of IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, Oct. 2025.

2025.09.21

Hitoshi Suda, Junya Koguchi, Shunsuke Yoshida, Tomohiko Nakamura, Satoru Fukayama, and Jun Ogata, "IdolSongsJp corpus: A multi-singer song corpus in the style of Japanese idol groups," in Proceedings of the 26th International Society for Music Information Retrieval (ISMIR) Conference, Sep. 2025.

続きはこちら

研究者紹介（職別五十音順）

役職＆名前	専門分野	メールアドレス　HP
研究チーム長深山覚	メディア情報学、音響信号処理、音楽情報処理	s.fukayama[at]aist.go.jp https://sites.google.com/view/sfukayama/
主任研究員中村友彦	信号処理的深層学習, 音響信号処理，音楽情報処理	tomohiko-nakamura[at]aist.go.jp https://tomohikonakamura.github.io/Tomohiko-Nakamura/index.html
主任研究員伊藤信貴	音響信号処理、音源分離、アレイ信号処理	nobutaka.itou[at]aist.go.jp https://nobutaka-ito.github.io/index-j.html
研究員須田仁志	音声情報処理、歌声情報処理	suda.h[at]aist.go.jp https://gavo.t.u-tokyo.ac.jp/~hitoshi/
特定フェロー（BOOST）齋藤佑樹	音声合成, 音声品質評価	yuuki.saitou[at]aist.go.jp
招聘研究員（AIエンジニア）瀧澤大吾	AIシステム	daigo.takizawa[at]aist.go.jp
産総研特別研究員平岩樺生	音響信号処理、音楽情報処理	kai.hiraiwa[at]aist.go.jp
リサーチアシスタント唐津裕貴	音楽情報処理	karatsu-hiroki[at]aist.go.jp
リサーチアシスタント今村奏海	音響信号処理	kanami-imamura[at]aist.go.jp
リサーチアシスタント松山直哉	音響信号処理	matsuyama.ra[at]aist.go.jp
リサーチアシスタント恩田　健太郎	音声信号処理, 音声合成	k.onda[at]aist.go.jp
リサーチアシスタント髙橋舜	音声言語処理	takahashi.shun.tq9[at]aist.go.jp
リサーチアシスタント滝沢力	音響合成	takizawa.riki[a]aist.go.jp
リサーチアシスタント戸田菜月	音声生成	natsuki.toda[at]aist.go.jp
客員研究員出向中（経済産業省）緒方淳	音声言語処理、音響・振動解析	jun.ogata[at]aist.go.jp
客員研究員（早稲田大学教授）小川哲司	音声・音響処理、異常検知
客員研究員（慶應義塾大学准教授）高道慎之介
客員研究員（東京都立大学准教授）塩田さやか	音声信号処理
協力研究員（東京都市大学講師）佐藤圭浩	画像・信号処理、３次元構造解析