自然言語処理:第12回 音声翻訳 自動要約概論.

Slides:



Advertisements
Similar presentations
北海道大学 Hokkaido University 1 情報理論 講義資料 2016/06/22 情報エレクトロニクス学科共通科目・2年次・第 1 学期〔必修 科目〕 講義「情報理論」第 5 回 第 3 章 情報源のモデル [ 後半 ] 3.5 情報源のエントロピー.
Advertisements

地図の重ね合わせに伴う 位相関係の矛盾訂正手法 萬上 裕 † 阿部光敏* 高倉弘喜 † 上林彌彦 ‡ 京都大学工学研究科 † 京都大学工学部 * 京都大学情報学研究科 ‡
データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
コーパス言語学実践 2006 年度 2 学期 第 2 回. 2 本日の内容 前半の作業について – 語彙調査の演習 – 用語の説明 語彙,単位語,延べ語,異なり語,見出し 語 作成作業 その1 – データ収集開始.
電子書籍の検索機能の改善 木下研究室 201002713 鴫原 善寿. 背景 スマートフォンなどの携帯端末の普及と ともに電子書籍に注目が浴びた。中でも amazon の kindle など電子書籍の専用端末も 現れた。 電子書籍はデータなので本棚もいらず、 持ち運びも容易になるなど様々な恩恵を もたらした。
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
データの圧縮.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
最大エントロピーモデルに基づく形態素解析と辞書による影響
「わかりやすいパターン認識」 第1章:パターン認識とは
第11章 プレゼンテーションの基本スキル 1 プレゼンテーションとは 2 プレゼンテーションの種類と特徴 3 プレゼンテーションツール
国内線で新千歳空港を利用している航空会社はどこですか?
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
日本語統語論:構造構築と意味 No.1 統語論とは
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
読んだもの1 P0145R1: Refining Expression Evaluation Order for Idiomatic C++
スコアによるキューブアクションの違い なにが“学会”発表にふさわしいのか考える。結論自体は分かっていた。そこに至るまでのプロセスが新しい。(かもしれない) 少なくとも整理されていて、わかりやすい。また、視覚的に覚えやすい。
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
Webサイト運営 09fi118 橋倉伶奈 09fi131 本間昂 09fi137 三上早紀.
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
形態素解析および係り受け解析・主語を判別
テキストの類似度計算
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介.
2011年6月24日(金) 於 名桜大学言語学習センター 国際学群 伊藤孝行
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
平成22年6月15日 図書系職員のための アプリケーション開発講習会
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
複数の言語情報を用いたCRFによる音声認識誤りの検出
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
環境リスクマネジメントに関する 検索システム
情報検索(6) メディア検索の仕組み 教員 岩村 雅一
知識情報演習Ⅲ(後半第3回) 辻 慶太
長崎大学工学部 情報システム工学科 「パターン認識」って・・・ 何? 宮原・喜安研究室.
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
2018/9/10 ACL読み会 名古屋大学大学院 M2 佐藤・松崎研 土居裕典.
知識情報演習Ⅲ(後半第2回) 辻 慶太
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
Data Clustering: A Review
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
知識情報演習Ⅲ(後半第3回) 辻 慶太
文書分類モデルの統計的性質に関する一考察
データモデリング エンティティの切り出し.
超短期トレードで生き残るためのテクニックと考え方
ブースティングとキーワードフィルタリング によるシステム要求検出
構造的類似性を持つ半構造化文書における頻度分析
設計情報の再利用を目的とした UML図の自動推薦ツール
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
自然言語処理2015 Natural Language Processing 2015
Windows10の基本操作 第3章 マウスとキーボード 2014/04/09 第1回の説明のポイントは、ここです。
4.プッシュダウンオートマトンと 文脈自由文法の等価性
アルゴリズム入門 (Ver /10/07) ・フローチャートとプログラムの基本構造 ・リスト ・合計の計算
欠陥検出を目的とした類似コード検索法 吉田則裕,石尾隆,松下誠,井上克郎 大阪大学 大学院情報科学研究科
ソフトウェア理解支援を目的とした 辞書の作成法
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
情報処理Ⅱ 2007年12月3日(月) その1.
イラストで学ぶ 音声認識 荒木雅弘 著 講談社 2015.
コンパイラ 2012年10月11日
自然言語処理2016 Natural Language Processing 2016
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
プログラミング論 バイナリーサーチ 1.
Presentation transcript:

自然言語処理:第12回 音声翻訳 自動要約概論

音声翻訳 音声認識の目的 声Aが聞こえた時、一番それらしい文W を見つける :文W がどんな声Aで言われるか 音としての性格             音としての性格         :文W がまともな文か             言葉としての性格

音声翻訳 英日統計翻訳 与えられた英文 に対し、最も確率の高い 日本語文 を見つける問題 : 翻訳モデル 英文がその日本語文の 与えられた英文  に対し、最も確率の高い 日本語文   を見つける問題        : 翻訳モデル 英文がその日本語文の         翻訳としてふさわしいかどうか        : 言語モデル  日本語文らしいか

音声翻訳 音声認識と統計翻訳では出力が同じ。 特に、右辺の言語モデルは全く同じ。

音声翻訳 音声認識の入力 どうやって「あいうえお」を聞き分けているのか? 50音ごとに音色が違う 大きさ (振幅) 高さ(波長) 波の形 =音色 =50音

音声翻訳 声帯で音を出し、それを口の動きで加工して、 違う音色にする。 この、口の動きを数値化したものが 「音声特徴量」

音声翻訳 韻律等で意味が変わる場合がある そもそも韻律を正しく認識することが難しい 韻律で疑問、平常を表現した場合、これを考慮 しないと、意味が全くことなる 現状の音声翻訳での最大の問題の一つ 意味が反対になるぐらいなら、わからない 方がまし

音声翻訳 音声認識と統計翻訳の結合 どちらも統計をベースにしているので、相性がいい ルールベース  音声認識が文法に合わない結果を出す     音声認識が文法に合わない結果を出す 音声認識で一番良いスコアの認識結果が 一番良い翻訳結果になるとは限らない

音声翻訳 音声認識と統計翻訳の結合 音声認識スコアと統計翻訳スコアの合計で評価 音声認識スコアが悪ければ、統計翻訳スコアの 合計で一位にはならないだろう 音声認識スコアの上位N位候補だけ翻訳する (パラメータ推定の時と同じ考え)

音声翻訳 音声認識と統計翻訳の結合 音声認識スコアと統計翻訳スコアの合計で評価 効果はあるが、大きくない 認識誤りをおこすと、翻訳結果に大きな影響を 及ぼす場所とそうでない場所がある 音声翻訳のこれからの大きな課題

自動要約とは 要約とは 元のテキスト(原文)の内容を、より短いテキストで 簡潔にまとめること、あるいはその結果のテキスト。 自動要約とは 元のテキストを、与えられた要約率で自動的に 要約すること 要約文の文字(文)数  要約率 =  原文の文字(文)数 

人間の要約手法 まず、重要な文を抽出し、その文に対し、 次の操作を行う。 不要な句の削除(文短縮) 短縮した文を他の分につなぐ(文結合) 構文的変形 句の言い換え(語彙の入れ替え) 句の具体化/抽象化 文の並び替え

人間の要約手法 まず、重要な文を抽出し、その文に対し、 次の操作を行う。 不要な句の削除(文短縮) 短縮した文を他の分につなぐ(文結合) 構文的変形 句の言い換え(語彙の入れ替え) 句の具体化/抽象化 文の並び替え

重要文抽出 何らかの情報をもとにして、各文に対して重要度を計算する。 重要度が上位の文から順に、指定された要約率に達するまで、文を選択する。 選択した文を出てきた順に並べる。

重要文抽出 重要度とは? テキスト中に含まれる単語の重要度を利用する(重要な単語が含まれる文ほど重要)。 テキスト中の文の位置を利用する(先頭や最後には重要な文が現れやすい)。 タイトル等を利用する(タイトルに現れる語を含む文は重要)。 手がかり表現を利用する(「本講義では...す る」とある場合、...の部分が重要)。

重要文抽出 重要度とは? テキスト中に含まれる単語の重要度を利用する(重要な単語が含まれる文ほど重要)。 テキスト中の文の位置を利用する(先頭や最後には重要な文が現れやすい)。 タイトル等を利用する(タイトルに現れる語を含む文は重要)。 手がかり表現を利用する(「本講義では...す る」とある場合、...の部分が重要)。

重要文抽出 単語の重要度 1) 文中に現れる名詞を対象とし、そのその出現回数を重要度にする

重要文抽出

重要文抽出 TF・IDF 特定の分野が与えられた時、その分野のキーワード を探す その分野にだけ、よく出てくる形態素が適切 IDF  log(全分野のドキュメント数 /その形態素が現れたドキュメント数)

重要文抽出 TF 全分野でのその形態素の出現数 多ければ、たくさんのドキュメントがヒット (しかし、ゴミが入るかもしれない) IDF  log(全分野のドキュメント数 /その形態素が現れたドキュメント数)   ドキュメントと絞り込むことができる   (注:全てのドキュメントに現れれば0 重要度 = TF × IDF

文短縮 文から重要でない文節を取り除く。 ただし、重要な文節の係先(の係先)は取り除かない。 国民党、/ANC側は/今後も/交渉を/続け、/なお/選挙参加の/道を/開いておくという。 文から重要でない文節を取り除く。 ただし、重要な文節の係先(の係先)は取り除かない。 国民党、/ANC側は/選挙参加の/道を/開いておくという。

文短縮 言い換えによる短縮 動作の定義文 説得する:よく話して納得させる 納得する:物事を理解して承認する 承認する:相手の言い分を聞き入れる

文短縮 説得する:よく話して納得させる 納得する:物事を理解して承認する 承認する:相手の言い分を聞き入れる 私は彼女に事情を話し、 彼女は私のいうことを理解し、 聞き入れてくれた。 私は彼女を説得した

要約の評価 要約システムに改造を加え、その結果性能が 上がったかどうかを調べるためには? 人間が評価すると? 大量の要約結果の評価はコストが大変 公平な評価ができないかもしれない 自動評価

要約の評価 重要文抽出に対する評価 人間なら選ぶ文がたくさん選ばれている 人間なら選ばない文がなるべく含まれない 1)  再現率  2)  適合率 再現率と適合率を同時に評価する尺度がF値

要約の評価 要約に含まれる重要文数 再現率 = 人間が選んだ重要文数 要約に含まれる重要文数 適合率 = 要約の文数 要約に含まれる重要文数  再現率 =  人間が選んだ重要文数  要約に含まれる重要文数  適合率 =  要約の文数  しかしながら、要約率は予め与えられているので (つまり、文数は固定なので)どちらかだけでよい

要約の評価 Pseudo-utility 人間が選んだ重要文の中にも、非常に重要な文と、 そうでないものがあるのでは? 要約率の低い要約でも選ばれた重要文は、 重要度が高い。 要約率の逆数と文の重要度とする。 10%で選ばれれば、重要度1/10 50%なら1/50

要約の評価 50%で システム1= 3/5 システム2= 3/5 重みをかけると 人間:1/10+1/30+1/50+1/50+1/30 = 31/150 S1 : 1/30+1+50+1/30 = 13/150 S2 : 1/10+1+30+1/30 = 25/150

要約の評価 低い要約率に関しては怪しそう

要約の評価 BLEU(機械翻訳の自動評価基準) ある程度の長さの単語列が正しければ情報が 得られる ある程度の長さ = 4 BLEU = 4単語列(4-gram)の適合率 統計翻訳では、翻訳された単語の数は翻訳性能が 変わってもあまり変わらないので、適合率、再現率 どちらかでもいい

要約の評価 BLEU(機械翻訳の自動評価基準) ある程度の長さの単語列が正しければ情報が 得られる ある程度の長さ = 4 BLEU = 4単語列(4-gram)の適合率 要約も要約率が与えられれば、語数が同じなので 適合率、再現率どちらかでもいい

要約の評価 いい翻訳とは  原文(参照訳)と意味が近い いい要約とは  人間の要約と意味が近い BLEUは翻訳性能の尺度だから、機械翻訳結果と 参照訳の意味の近さの尺度と言ってもよい だったら、自動要約結果と人手要約の意味の 近さの尺度に使っても良い

自動要約の現状 南アフリカの民間の自然動物保護区で、体長3.9メートルのアフリカロック パイソン(アフリカニシキヘビ)が体重13.8キロの大型のヤマアラシを丸の みして、死んだ。保護区の管理者が26日、明らかにした。  エランド湖動物 保護区(Lake Eland Game Reserve)のジェニファー・フラー(Jennifer Fuller)氏はAFPの取材に、通常であれば、このニシキヘビはヤマアラシを 消化できていただろうと語った。だがこのヘビはヤマアラシを吐き出そうと して、トゲが刺さって死んだという。 フラー氏によると、ヘビはストレスを受けると、逃げるために丸のみにしたも のを吐き出す習性がある。ニシキヘビのお腹が膨れ上がってる様子に驚い て、同保護区を訪れていた多くの人々が集まったことから、ヘビはストレスを 感じたのではないかと同氏は推測している。 このヘビはヤマアラシをのみこんだ6日後に死んだ。 アフリカニシキヘビはアフリカ最大のヘビで、レイヨウなど、ヤマアラシよりも さらに大きな動物を丸のみすることで知られている。

自動要約の現状 50%に要約 南アフリカの民間の自然動物保護区で、体長3.9メートルのアフリカロック パイソン(アフリカニシキヘビ)が体重13.8キロの大型のヤマアラシを丸の みして、死んだ。保護区の管理者が26日、明らかにした。  エランド湖動 物保護区(Lake Eland Game Reserve)のジェニファー・フラー(Jennifer Fuller)氏はAFPの取材に、通常であれば、このニシキヘビはヤマアラシを 消化できていただろうと語った。このヘビはヤマアラシをのみこんだ6日後 に死んだ。

自動要約の現状 25%に要約 南アフリカの民間の自然動物保護区で、体長3.9メートルのアフリカロック パイソン(アフリカニシキヘビ)が体重13.8キロの大型のヤマアラシを丸の みして、死んだ。保護区の管理者が26日、明らかにした。  このヘビは ヤマアラシをのみこんだ6日後に死んだ。

複数テキストの要約 複数テキストの要約の必要性 Hogehoge について知りたいと思う。 ぐぐる。 大量にヒットする。

複数テキストの要約 大量にヒットする。 仕方がないので、とりあえず最初のテキストを読む(長ければ自動要約する)。 次も読んでみたら、最初のと言ってることが違う。 ????

複数テキストの要約 複数テキストの要約の必要性 複数のテキストをまとめて、それを要約として提示することが、非常に有効。

複数テキストの要約 単一テキストの要約との違い 関連するテキストを収集する必要がある。 要約率が圧倒的に低い。 重複した、あるいは矛盾した内容をまとめる必要がある。 文を並べる順序を考慮する必要がある。 何についてまとめるかで、結果を変える必要がある。(XXした結果について知りたい場合と、XXした原因につて知りたい場合では違う)

今後の応用 検索のためのナビゲーション 端末向けの情報圧縮 障害者への情報提示 議事録、発表資料の作成

質問&スライド yama@info.kindai.ac.jp http://www.info.kindai.ac.jp/NLP