イラストで学ぶ 音声認識 荒木雅弘 著 講談社 2015.

Slides:



Advertisements
Similar presentations
はじめてのパターン認識 第1章 第4グループ 平田翔暉. パターン認識 パターン認識 o 観測されたパターンを、あらかじめ定められ たクラスに分類すること クラス o 硬貨: 1 円玉、 5 円玉、 10 円玉、 50 円玉、 100 円玉、 500 円玉 o アルファベット: 26 種類 o 数字:
Advertisements

知能情報工学 年4月26日 吉川雅博 第3回第3回 k最近傍法. プロトタイプによるNN法の流れ 2 AD変換前処理部特徴抽出部識別部 ・標本化 ・量子化 ・ノイズ除去 ・正規化 識別辞書 (プロトタイプ) 音声や画像 (アナログ信号) 識別 結果 識別が容易な 特徴を抽出 プロトタイプと比較.
リッピング違法化と 違法ダウンロード厳罰化. リッピングとは DVD ビデオソフトや、音楽 CD などのデジタルデータを PC で処理 できるようなファイル形式 (PC やポータブル機器で再生しやすい 形式 ) に変換して PC 内に取り込み保存すること リッピング違法化により、著作権保護機能がついた媒体からの.
高度情報演習 1A “ テーマC ” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 芝浦工業大学 工学部 情報工学科 青木 義満 2006/04/10.
島根大学法文学部 野田哲夫 (情報経済論担当)
Signal Masterによる フィルタバンクの実装
第四章 情報源符号化の基礎 4・1 情報量とエントロピー 4・2 エントロピー符号化 4・3 音声符号化 4・4 画像符号化.
「わかりやすいパターン認識」 第1章:パターン認識とは
3.表現メディアの特性 文字=日時や数値などを正確に伝えることに適している (例)新聞,法律,小説
電子書籍を さがす どんな書籍があるの? Maruzen eBook Libraryは、学術機関向け和書の電子書籍提供サービスです。
コンパイラ 2011年10月17日
Deep learningによる 読唇システム
第2章 ネットサービスとその仕組み(前編) [近代科学社刊]
科学技術からはじまるアート ~創造する研究者たち~ アルバロ カシネリ 東京大学情報理工学系研究科 助教 石川・小室研究室.
電子書籍を さがす どんな書籍があるの?
画像処理論.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
フォークソノミー(folksonomy)
SPA 報告
Myoungkyu Song and Eli Tilevich 発表者: 石尾 隆(大阪大学)
3-Q-28 話者交替を考慮したシステムへの問い合わせと雑談の判別
ICT活用指導力向上研修会 ~児童生徒の情報活用能力を高める指導方法~
情報処理学会・経営情報学会 連続セミナー第3回 情報システム構築アプローチ 主旨
学校の コンピュータ 発表者 Miho Harusawa.
インターネット活用法 ~ブラウザ編~ 09016 上野喬.
広島祈念館(現行) 動画や静止画資料 ・証言者情報 ・証言動画 ・記録動画 ・静止画 動画・静止画DB 来館者やインターネットへの情報の提供
ユビキタス環境における コミュニケーション・ツール選択支援機構の提案
メディアとコンテンツ メディアコミュニケーション論Ⅲ 4/25/08.
画像工学 2011年10月6日 担当教員 北川 輝彦.
高性能コンピューティング論2 第1回 ガイダンス
SS2009 形式手法の適用ワーキング グループの報告
コンパイラ 2012年10月15日
IT時代の ヒューマン・インタフェースを考える
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
ヒューマンインタフェース 電子機械工学専攻 第2学年 後期 開講
データ分析基礎c(2012年以降入学) 情報編集基礎c(2011年以前入学)
どこでもコンピュータ 講義資料.
2007のキーワード.
人工知能特論2007 東京工科大学 亀田弘之.
Placement Manual Speaking
高度情報演習1C 実践 画像処理プログラミング
画像工学 2012年10月3日 担当教員 北川 輝彦.
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
情報検索(6) メディア検索の仕組み 教員 岩村 雅一
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
議事録作成支援 Webアプリケーションの開発 リアルタイム通信を用いた合意形成を目指して
岩村雅一 知能情報工学演習I 第13回(後半第7回) 岩村雅一
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
音声認識・翻訳 Android アプリケーション制作
A03 音声インターフェイスによる インスタントメッセージング エージェントの開発
工学部 電気電子工学科 白井研究室 T 山田 翔也
Data Clustering: A Review
ディジタル化の 利点と問題点 高等学校 情報C 沖縄県立総合教育センター IT教育課 〒 沖縄県沖縄市与儀587番地
tranService Next Generation
記憶の仕組みを知って 記憶力を上げよう!.
3.表現メディアの特性 文字=日時や数値などを正確に伝えることに適している (例)新聞,法律,小説
ICTを活用した授業づくり ②教材研究・指導の準備や 評価にICTを活用する
インタラクションの諸相 さまざまなインタラクションを位置づける要素 モダリティー(視覚的/聴覚的/…) 方向(入力/出力/対話的)
自然言語処理2015 Natural Language Processing 2015
Webページタイプによるクラスタ リングを用いた検索支援システム
視覚補助のための物体検出 白井研究室 T 若松大仁
コンパイラ 2012年10月11日
自然言語処理2016 Natural Language Processing 2016
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
1.2 言語処理の諸観点 (1)言語処理の利用分野
Placement Manual Speaking
Presentation transcript:

イラストで学ぶ 音声認識 荒木雅弘 著 講談社 2015

1. はじめに 1.1 音声認識とは 1.2 音声認識の歴史 1.3 どこで役立つのか 1.4 何が難しいのか 1.5 本書のねらい

1.1 音声認識とは 音声認識の定義 音声認識における問題設定 人間が声で話す言葉を文字に 変換する技術 人間が声で話す言葉を文字に 変換する技術 機械可読な意味表現に変換する ところまでを含む場合もある 音声認識における問題設定 使用環境 利用者 単語数 出力

1.2 音声認識の歴史 2015年以降 ・ロボットの音声  インタフェース ・スマートスピーカー

1.3 どこで役立つのか ヒューマンインタフェースとして 携帯端末(スマートフォン、タブレット)や家 電・スマートスピーカーなどへの入力手段 携帯端末(スマートフォン、タブレット)や家 電・スマートスピーカーなどへの入力手段 カーナビなど、ハンズフリーが要求される状況 情報蓄積・検索 会議の議事録作成 テレビ放送・動画への字幕付与 音声検索

1.4 何が難しいのか

1.5 本書のねらい 音声認識技術の難しさへの対処 分野横断的な技術である イラストによる直観的な理解    イラストによる直観的な理解 パターン認識問題の中でも最も難しいクラスの問題    WFSTによる解決法の解説 実用化の際にノウハウが必要    ノウハウを学べるフリーソフトの紹介

本書の構成