ディープラーニングによる音声認識
開催日 |
12:30 ~ 16:30 締めきりました |
---|---|
主催者 | 株式会社 情報機構 |
キーワード | 機械学習・ディープラーニング UI/UX/ヒューマンインターフェース |
開催エリア | 東京都 |
開催場所 | 【千代田区】PAT-T606会議室 |
交通 | 【JR・地下鉄・つくばエクスプレス】秋葉原駅 【地下鉄】岩本町駅 |
ディープラーニングの基礎から音声認識の原理、最新動向、活用の留意点まで
動作原理、最新動向、利用する際の注意点などを詳解!
講師
(株)日立製作所 研究開発グループ 研究員 神田 直之 先生
【講師紹介】
2006年~2014年 日立製作所
2014年~2016年 情報通信研究機構 (出向)
2016年~2017年 情報通信研究機構 協力研究員(兼任)
2016年~現在 日立製作所 (出向復帰)
一貫して音声認識・音声言語処理の研究開発に従事。日立製作所では大規模音声データの検索システム,コールセンタ向け音声認識システム,ロボット向け音声認識システムの研究開発等に携わる。また情報通信研究機構では,多言語音声翻訳システムのための音声認識技術の研究開発に従事。その他,音声翻訳の国際会議IWSLT2014において英語音声認識評価トラック1位等。音響学会,情報処理学会,人工知能学会,IEEE各会員。
受講料
1名41,040円(税込(消費税8%)、資料付)
*1社2名以上同時申込の場合 、1名につき30,240円
*学校法人割引 ;学生、教員のご参加は受講料50%割引。
セミナーポイント
本セミナーでは近年技術進展の著しいディープラーニングに基づく音声認識技術について,基礎から最新動向までを解説します。現在の音声認識において,ディープラーニングは必須の要素技術となっています。ただし,音声へのディープラーニングの適用にはいくつかの方式があり,それぞれ利点や欠点が知られています。また,ディープラーニングによって音声認識精度は飛躍的に向上しましたが,実利用の際には未だに注意すべき制約や考慮すべき点があります。
本セミナーでは,これらの技術的な背景や動作原理を基礎から解説するとともに,活用事例を通して音声認識を利用する際の注意点などについても紹介します。
■ この講座を受講して得られる情報・知見:
・ディープラーニングの基礎
・音声認識の動作原理
・ディープラーニングに基づく音声認識の最新動向
・音声認識技術を利用する際の留意点
セミナー内容
1 ディープラーニングの基礎
1.1 背景,ディープラーニング登場から現在まで
1.2 機械学習とは?
1.3 パーセプトロンからディープニューラルネットワーク(DNN)まで
1.4 誤差逆伝搬法による学習
1.5 ディープラーニングの特徴
2 音声認識の基礎
2.1 音声の生成モデルと音声認識
2.2 言語モデル・発音辞書・音響モデル
2.3 音声認識のデコーディング
3 ディープラーニングによる音声認識その1
〜生成モデルに基づく従来方式の拡張
3.1 DNNと生成モデルのハイブリッド(DNN-HMM方式)
3.2 特徴量抽出器としての活用(Tandem方式)
3.3 RNNによる言語モデル
4 ディープラーニングによる音声認識その2
〜End-to-Endモデルに基づく新方式,利点と注意点
4.1 Connectionist Temporal Classification (CTC)
4.2 Sequence-to-sequence (Seq2Seq)
4.3 各方式の比較
5 音声認識分野の最新研究動向
5.1 様々なニューラルネットワーク構成の検討
5.2 耐雑音処理
5.3 モデル適応,データ拡張
5.4 Wake up word検出(呼び覚まし音声検出)
5.5 その他の最新研究トピック紹介
6 音声認識の活用に向けて
6.1 音声認識を利用する際の留意点,事例を交えながら
6.2 音声認識で利用されるOSSの紹介
7 まとめと今後の展望
<質疑応答>