スマホ・AIスピーカー、ロボット…
インタフェースとしての音声認識対話技術の可能性

音声対話の今を識る! 今後の課題克服への指針を得る!


講師


徳島大学 大学院 社会産業理工学研究部 知能情報系
教授 博士(工学) 北岡 教英 先生
※ 2019年5月より 豊橋技術科学大学 大学院工学研究科 教授

【講師紹介】
・1994年4月~2001年3月 日本電装株式会社(現・株式会社デンソー).:音声認識の研究および音声対話ナビゲーションシステムの開発に従事.自動車運転中という特殊な環境において操作されるカーナビゲーションシステムのために,大語彙の単語認識システムを開発して日本全国40万地名の認識に応用し,それを用いた音声対話手法を考案した.さらにカーナビゲーションシステムに実装し,製品化,また,英語など多言語化も行った.
・1997年4月~2000年3月 豊橋技術科学大学大学院工学研究科博士後期課程電子・情報工学専攻 在学.博士(工学).:雑音処理,認識結果の信頼度・リジェクション手法,音声対話インタフェース設計など,音声対話システムの頑健性に関する研究に従事.
・2001年4月 豊橋技術科学大学工学部 助手. /・2003年4月 同 講師.
・2006年10月 名古屋大学大学院情報科学研究科 助教授.
・2007年4月 同 准教授.:音声認識,音声対話システム,マルチモーダルインタフェースの研究に従事.
・2014年10月 徳島大学大学院ソシオテクノサイエンス研究部 教授
・2017年4月 徳島大学大学院社会産業理工学研究部知能情報系 教授(現職)
・2019年5月 豊橋技術科学大学大学院工学研究科・教授


受講料


1名46,440円(税込(消費税8%)、資料・昼食付)
*1社2名以上同時申込の場合 、1名につき35,640円
*学校法人割引 ;学生、教員のご参加は受講料50%割引。


セミナーポイント


■ 講師より
 音声認識は携帯電話などにも搭載され、一般の方にも知られる技術となってきた。その背景には、近年の深層学習に基づいた手法の導入によりもたらされた音声認識技術のブレークスルーがある。この最新の音声認識技術を紹介するとともに、AIスピーカやスマホ、あるいは人型ロボットなどの機械とやり取りをするための対話の技術、および応用システムの現状と今後、課題克服への展望について述べる。

■ 受講対象者
・各企業の技術者、研究者、開発者、新事業企画者
 音声認識・対話技術の研究者開発者、産業応用を目指す方
・システム開発者
・音声認識・対話技術周辺の技術者・研究者
 音声認識・対話技術により社会がどう変化するか、どんなニーズ・課題や市場が生まれるか
 などを調査する立場の方々

■ 受講して得られる情報・知見
・音声生成の概要
・音声認識の基礎技術と最近の動向
・音声認識の応用研究事例
・音声認識技術の現状の課題と展望・可能性

▽ 前回の同講師セミナー受講者の声(アンケートより)
「特に応用事例のところが興味深かった」(自動車部材研究開発)
「モンゴル語への応用を目指して勉強中。大変有意義でした」(システムエンジニア)
「内容の難易度も適切で概ね満足です」(ロボット系・システム開発)
「専門外なので基礎から学びにやってまいりました。有益な情報をありがとうございました」
 (マイク開発)
「音声認識の今後・将来動向が知れたのがよかった」(システム開発)
「Deep Learningの一環で参加。満足しました」(開発)


セミナー内容


1 音声生成のメカニズム
 1.1 日本語の音声
 1.2 発声器官と音声
 1.3 工学からみた発声器官‐ソース・フィルタモデル‐
 1.4 発声器官形状推定としての音声認識

2 音声認識のための信号処理
 2.1 音声の取り込み-サンプリングとA/D変換-
 2.2 短時間分析
 2.3 発声器官形状情報の取り出し‐スペクトル包絡の推定‐
 2.4 MFCC(Mel-Frequency Cepstral Coefficients)の導出
 2.5 デルタ係数の利用

3 隠れマルコフモデル(Hidden Markov Model; HMM)による音声認識
 3.1 HMMによる音声認識アルゴリズム
 3.2 連続音声認識
 3.3 WFSTによる音声認識システム
 3.4 Deep Neural Network (DNN)とHMMの融合‐
  3.4.1 特徴抽出器としてのDNN‐TANDEM法‐
  3.4.2 出力確率推定器としてのDNN ‐DNN-HMM法‐
 3.5 DNN-HMMとGMM-HMMの比較

4 音声認識技術の最新動向 ‐End-to-end音声認識‐
 4.1 End-to-endモデルとは
 4.2 Sequence-to-sequenceモデル
 4.3 Connectionist Temporal Classification (CTC)

5 音声対話システム
 5.1 音声対話システムの構成
 5.2 一問一答システム
 5.3 オートマトンによる対話制御
 5.4 より知的な対話を目指して
 5.5 Neural networkを用いた音声対話

6 認識の応用事例‐過去から将来まで‐
 6.1 テレビ字幕制作システム
 6.2 CALLシステム
 6.3 音声検索 ‐音声ドキュメント処理‐
 6.4 自動車内インタフェース

7 音声認識の今後
 7.1 音声認識の課題と今後
 7.2 音声対話と応用システムの課題と今後

8 まとめ
 

 <質疑応答・名刺交換・個別相談>


※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

46,440円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

MAP

【品川区】きゅりあん

【JR・東急・りんかい線】大井町駅

主催者

キーワード

情報技術   機械学習・ディープラーニング   UI/UX/ヒューマンインターフェース

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

46,440円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

MAP

【品川区】きゅりあん

【JR・東急・りんかい線】大井町駅

主催者

キーワード

情報技術   機械学習・ディープラーニング   UI/UX/ヒューマンインターフェース

関連記事

もっと見る