音声認識技術の開発と実環境への応用
開催日 |
10:30 ~ 16:20 締めきりました |
---|---|
主催者 | 株式会社 技術情報協会 |
キーワード | UI/UX/ヒューマンインターフェース 機械学習・ディープラーニング 情報技術 |
開催エリア | 東京都 |
開催場所 | 【品川区】技術情報協会セミナールーム |
交通 | 【JR・地下鉄】五反田駅 【東急】大崎広小路駅 |
★ 雑音環境下での音声強調と雑音除去の要点を学ぶ
講師
1.埼玉大学 情報メディア基盤センター
理工学研究科 数理電子情報部門
教授 工学博士 島村 徹也 氏
2.大阪電気通信大学 情報通信工学部 情報工学科
講師 博士(情報科学) 早坂 昇 氏
3.名古屋大学 情報基盤センター
教授 博士(工学) 戸田 智基 氏
受講料
1名につき55,000円(消費税抜き・昼食・資料付き)
〔1社2名以上同時申込の場合1名につき50,000円(税抜)〕
プログラム
< 10:30〜12:10>
1.雑音に頑強な話者認識技術に向けた深層ニューラルネットワークの応用
埼玉大学 島村 徹也 氏
【講演概要】
雑音環境下での認識技術が最近特に注目を集めている。深層学習を利用する方法の有効性が認知されてきたためであるが、その前に改めて音声と雑音との関係性を考え、 音声強調の必要性を論じる。次に、話者認識問題と特に取り上げ、人間の特徴量として基本周波数の有効利用の必要性を説く。雑音環境下での基本周波数抽出と話者認識の実現について中心的に議論する。最近の研究動向にも最後、言及する予定である。
【プログラム】
1.音声と雑音
1.1 問題設定
1.2 音声と雑音の性質
2.音声強調技術
2.1 有力な各種方法
2.2 相関関数を利用する方法の有効性
3.雑音環境下での話者認識
3.1 深層学習
3.2 基本周波数の利用
4.最近の研究動向
【質疑応答・名刺交換】
<12:50〜14:30>
2.雑音に対してロバスト(頑健)な音声認識の研究開発
大阪電気通信大学 早坂 昇 氏
【プログラム】
1.音声認識システムの分類と応用例の紹介
2.音声認識システムの普及阻害要因
3.音声認識の原理
4.ロバストな音声認識手法
5.加法性雑音の影響とその対策
6.乗法性雑音の影響とその対策
7.ハンズフリー音声認識システム
8.音声区間検出
9.未知語・不要語自動棄却
10.開発した音声認識システムの紹介
11.最新の研究成果紹介
【質疑応答・名刺交換】
<14:40〜16:20>
3.周囲環境に頑健な音声インタフェースの実現に向けた体内伝導音声情報処理
名古屋大学 戸田 智基 氏
【講演概要】
音声インタフェースを利用する上で、人前での発話自体が躊躇われる、雑音の影響を受けるなど、音声という媒体の特徴に伴う本質的な問題が存在するため、その利便性は周囲の環境に大きく依存する。本講座では、周囲環境に対して頑健な音声インタフェースを実現する枠組みとして、体内伝導音声を活用する技術について述べる。基盤技術を概説するとともに、各種応用技術についても具体例を交えつつ紹介する。
【プログラム】
1. 音声インタフェースの問題点
1.1 周囲環境の影響
2. 体内伝導音声
2.1 体内伝導音声の収録
2.2 体内伝導音声の音響的特徴
3. 体内伝導音声強調技術
3.1 音声変換技術
3.2 体内伝導音声強調への適用
4. 体内伝導音声認識技術
4.1 音声認識技術
4.2 体内伝導音声認識への適用
5. 空気/体内伝導音声の相補的活用技術
5.1 空気/体内伝導音声の相補的特徴
5.2 空気/体内伝導音声情報処理
6. まとめと今後の課題
【質疑応答・名刺交換】