【音声認識】を網羅的に学ぶ! 応用事例や将来動向も!


講師


徳島大学 大学院 社会産業理工学研究部 知能情報系 教授 博士(工学)  北岡 教英 先生


講師紹介


・1994年4月~2001年3月 日本電装株式会社(現・株式会社デンソー).:音声認識の研究および音声対話ナビゲーションシステムの開発に従事.自動車運転中という特殊な環境において操作されるカーナビゲーションシステムのために,大語彙の単語認識システムを開発して日本全国40万地名の認識に応用し,それを用いた音声対話手法を考案した.さらにカーナビゲーションシステムに実装し,製品化,また,英語など多言語化も行った.
・1997年4月~2000年3月 豊橋技術科学大学大学院工学研究科博士後期課程電子・情報工学専攻 在学.博士(工学).:雑音処理,認識結果の信頼度・リジェクション手法,音声対話インタフェース設計など,音声対話システムの頑健性に関する研究に従事.
・2001年4月 豊橋技術科学大学工学部 助手. /・2003年4月 同 講師.
・2006年10月 名古屋大学大学院情報科学研究科 助教授.
・2007年4月 同 准教授.:音声認識,音声対話システム,マルチモーダルインタフェースの研究に従事.
・2014年10月 徳島大学大学院ソシオテクノサイエンス研究部 教授
・2017年4月 徳島大学大学院社会産業理工学研究部知能情報系 教授(現職)


セミナーポイント


■講師より
音声認識は携帯電話などにも搭載され、一般の方にも知られる技術となってきた。今後、本当に役に立つ技術となるためには、さらなる認識率の向上と共に、様々な環境や人への頑健性が必要になってくる。近年の深層学習に基づいた手法の導入により、音声認識にブレークスルーがもたらされつつある。これらの技術を紹介するとともに、その応用システムの現状と今後、課題克服への展望について述べる。

■受講対象者
・各企業の技術者、研究者、開発者、新事業企画者
 ・音声認識技術の研究者開発者、産業応用を目指す方
・システム開発者
・音声認識周辺の技術者・研究者
 ・音声認識技術により社会がどう変化するか、どんなニーズ・課題や市場が生まれるかなどを調査する立場の方々

■受講して得られる情報・知見
・音声生成の概要
・音声認識の基礎技術と最近の動向
・音声認識の応用研究事例
・音声認識技術の現状の課題と展望・可能性
*発表スライドについては公開可能なものに限り、印刷物での配布はもちろんPDFでも配布をします。

▽前回の同講師セミナー受講者の声(アンケートより)
「特に応用事例のところが興味深かった」(自動車部材研究開発)
「モンゴル語への応用を目指して勉強中。大変有意義でした」(システムエンジニア)
「内容の難易度も適切で概ね満足です」(ロボット系・システム開発)
「専門外なので基礎から学びにやってまいりました。有益な情報をありがとうございました」(マイク開発)
「音声認識の今後・将来動向が知れたのがよかった」(システム開発)
「Deep Learningの一環で参加。満足しました」(開発)


【セミナープログラム】


1 音声生成のメカニズム
 1.1 日本語の音声
 1.2 発声器官と音声
  1.2.1 声帯と調音器官
  1.2.2 モデルで見る発声
 1.3 工学からみた発声器官‐ソース・フィルタモデル‐
 1.4 発声器官形状推定としての音声認識

2 音声認識のための信号処理
 2.1 音声の取り込み
  2.2.1 音声のサンプリング
  2.2.2 A/D変換
 2.2 短時間分析
  2.2.1 窓かけ
  2.2.2 短時間フーリエ変換
 2.3 発声器官形状情報の取り出し‐スペクトル包絡の推定‐
  2.3.1 フィルタ=スペクトル包絡
  2.3.2 フィルタバンク分析
  2.3.3 メルフィルタバンク分析
 2.4 MFCC(Mel-Frequency Cepstral Coefficients)の導出
 2.5 デルタ係数の利用

3 隠れマルコフモデル(Hidden Markov Model; HMM)による音声認識
 3.1 ベクトル量子化
  3.1.1 ベクトル量子化と量子化誤差
  3.1.2 LBGアルゴリズム
  3.1.3 音声特徴量系列のラベル系列への変換
 3.2 離散分布型HMM
  3.2.1 HMMとは
  3.2.2 HMMによる音声認識
 3.3 連続分布型HMM
  3.3.1 離散分布から連続分布へ
  3.3.2 認識アルゴリズムと学習アルゴリズム
 3.4 連続音声認識
 3.5 WFSTによる音声認識システム

4 音声認識の最新動向 ‐Deep Neural Network (DNN)との融合‐
 4.1 HMMの識別的学習法
 4.2 音声認識におけるDeep Neural Network (DNN)
  4.2.1 特徴抽出器としてのDNN‐TANDEM法‐
  4.2.2 出力確率推定器としてのDNN ‐DNN-HMM法‐
 4.3 DNN-HMMとGMM-HMMの比較
 4.4 音声認識技術の今後の動向 ‐End-to-end音声認識に向けて‐

5 音声認識の応用事例‐過去から将来まで‐
 5.1 自動車内インタフェース
 5.2 テレビ字幕制作システム
 5.3 CALLシステム
 5.4 音声検索 ‐音声ドキュメント処理‐
 5.5 音声対話システム ‐一問一答から知的処理まで‐

6 音声認識の今後
 6.1 音声認識の課題と今後
 6.2 音声認識応用システムの課題と今後

7 まとめ

<質疑応答・名刺交換・個別相談>


※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


12:30

受講料

41,040円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

MAP

【品川区】きゅりあん

【JR・東急・りんかい線】大井町駅

主催者

キーワード

電気・電子技術

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


12:30

受講料

41,040円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

MAP

【品川区】きゅりあん

【JR・東急・りんかい線】大井町駅

主催者

キーワード

電気・電子技術

関連記事

もっと見る