知的メディア処理研究チーム
チーム概要

深山 覚
チーム長
インフォメーション
恩田健太郎(リサーチアシスタント)が日本音響学会第30回(2025年春季研究発表会)学生優秀発表賞を受賞しました。 母語話者音声のみを用いた外国語訛りに頑健な自動音声認識の実現に向けた離散トークンの活用の検討:恩田健太郎(東京大学/産業技術総合研究所)、深山覚(産業技術総合研究所)、井本桂右(京都大学)、齋藤大輔(東京大学)、峯松信明(東京大学)
和田仰(技術研修生)が音学シンポジウム2025(第143回音楽情報科学・第156回音声言語情報処理合同研究発表会)学生優秀発表賞を受賞しました。
順序を考慮したオーディオエフェクトチェインの推定に対する双曲埋め込み: 和田 仰 (東京大学/産業技術総合研究所)、中村 友彦 (産業技術総合研究所)、猿渡 洋 (東京大学)
滝沢力(リサーチアシスタント)が音学シンポジウム2025(第143回音楽情報科学・第156回音声言語情報処理合同研究発表会)優秀発表賞を受賞しました。
言語非依存な口真似による効果音合成手法PronounSEの評価: 滝沢 力 (京都産業大学/産業技術総合研究所),、平井 重行 (京都産業大学)、金崎 朝子 (東京科学大学)、須田 仁志 (産業技術総合研究所)
論文リスト
Kentaro Onda, Satoru Fukayama, Daisuke Saito, and Nobuaki Minematsu, "Advanced Modeling of Interlanguage Speech Intelligibility Benefit with L1-L2 Multi-Task Learning Using Differentiable K-Means for Accent-Robust Discrete Token-Based ASR," in Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, May 2026.
Kohei Asai, Wataru Nakata, Yuki Saito, and Hiroshi Saruwatari, "Geneses: Unified generative speech enhancement and separation," in Proceedings of The Joint Workshop on HSCMA and CHiME 2026 (IEEE ICASSP2026 Satellite Workshop), May 2026.
Kanami Imamura, Tomohiko Nakamura, Kohei Yatabe, and Hiroshi Saruwatari, "Dissecting performance degradation in audio source separation under sampling frequency mismatch," in Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, May 2026.
研究者紹介(職別五十音順)
| 写真 | 役職&名前 | 専門分野 | メールアドレス HP |
|---|---|---|---|
![]() |
研究チーム長 深山 覚 |
メディア情報学、音響信号処理、音楽情報処理 | |
![]() |
主任研究員 中村 友彦 |
信号処理的深層学習, 音響信号処理,音楽情報処理 | |
![]() |
主任研究員 伊藤 信貴 |
音響信号処理、音源分離、アレイ信号処理 | |
![]() |
研究員 須田 仁志 |
音声情報処理、歌声情報処理 | |
![]() |
特定フェロー(BOOST) 齋藤 佑樹 |
音声合成, 音声品質評価 | |
![]() |
招聘研究員(AIエンジニア) 瀧澤 大吾 |
AIシステム | |
![]() |
産総研特別研究員 平岩 樺生 |
音響信号処理、音楽情報処理 | |
リサーチアシスタント 唐津 裕貴 |
音楽情報処理 | ||
![]() |
リサーチアシスタント 今村 奏海 |
音響信号処理 | |
![]() |
リサーチアシスタント 松山 直哉 |
音響信号処理 | |
![]() |
リサーチアシスタント 恩田 健太郎 |
音声信号処理, 音声合成 | |
![]() |
リサーチアシスタント 髙橋 舜 |
音声言語処理 | |
![]() |
リサーチアシスタント 滝沢 力 |
音響合成 | |
リサーチアシスタント 戸田 菜月 |
音声生成 | ||
![]() |
リサーチアシスタント 有田 諒子 |
音声合成,歌声合成 | |
![]() |
客員研究員 出向中(経済産業省) 緒方 淳 |
音声言語処理、音響・振動解析 | |
![]() |
客員研究員 (早稲田大学教授) 小川 哲司 |
音声・音響処理、異常検知 | |
![]() |
客員研究員 (慶應義塾大学准教授) 高道 慎之介 |
||
![]() |
客員研究員 (東京都立大学准教授) 塩田 さやか |
音声信号処理 | |
![]() |
協力研究員 |
画像・信号処理、3次元構造解析 | |
![]() |
協力研究員 |
音声情報処理 |




















