シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム

Slides:



Advertisements
Similar presentations
著作権管理のための 関係の地図の記述について 200702887 市川 俊介. 研究背景 コンピューターやネットワーク機器の開発に より、文書や図面をネットワーク上で公開し たりすることが多くなる。 どんな著作物があるのかを知らずに公開し、 著作権を侵害したとされる例もあり、そのよ うな問題をどうすれば防ぐことができるのか.
Advertisements

音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
システム開発におけるユーザ要求の 明示的表現に関する一検討
顔表情クラスタリングによる 映像コンテンツへのタギング
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
相互作用図 FM11010 田中健太.
最大エントロピーモデルに基づく形態素解析と辞書による影響
「わかりやすいパターン認識」 第1章:パターン認識とは
形態素周辺確率を用いた 分かち書きの一般化とその応用
XHTML構文検証手法における スクリプト要素の静的解析アルゴリズム
Deep learningによる 読唇システム
言語体系とコンピュータ 第5回.
国内線で新千歳空港を利用している航空会社はどこですか?
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
神奈川大学大学院工学研究科 電気電子情報工学専攻
テキストマイニング, データマイニングと 社会活動のトレース
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
4Y-4 印象に残りやすい日本語パスワードの合成法
形態素解析および係り受け解析・主語を判別
テキストの類似度計算
セマンティクスを利用した 図書検索システム
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
日本語解析済みコーパス管理ツール 「茶器」
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
川口真司 松下誠 井上克郎 大阪大学大学院情報科学研究科
音韻論⑤ ----.
検索エンジンを利用した Covert Channelの検出
プログラム実行履歴を用いたトランザクションファンクション抽出手法
オントロジーを使用した プログラム開発支援システムの提案
北大MMCセミナー 第74回 附属社会創造数学センター主催 Date: 2017年8月4日(金) 15:00~16:30
自然言語処理及び実習 第11回 形態素解析.
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
Javaクラスの利用関係を用いた ソフトウェア部品のカテゴリ階層構築法
高速剰余算アルゴリズムとそのハードウェア実装についての研究
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
その他の図 Chapter 7.
思考支援ツールを用いた 情報処理技術知識の学習方式
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
移動エントロピーによる 動的ネットワーク化を用いた SNSと商品購買の相互関係の分析
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
自動車レビュー簡潔化の手法の提案 情報理工学部・情報知能学科 4年 H206010 内輪健一 H206036 鈴木貴裕.
テキストマイニング, データマイニングと 社会活動のトレース
東京工科大学 コンピュータサイエンス学部 亀田弘之
背景 課題 目的 手法 作業 期待 成果 有限体積法による汎用CFDにおける 流体構造連成解析ソルバーの計算効率の検証
Number of random matrices
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
コーディングパターンの あいまい検索の提案と実装
東京工科大学 コンピュータサイエンス学部 亀田弘之
JavaScriptを含んだHTML文書に対する データフロー解析を用いた構文検証手法の提案
ブースティングとキーワードフィルタリング によるシステム要求検出
構造的類似性を持つ半構造化文書における頻度分析
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
大規模コーパスに基づく同義語・多義語処理
自然言語処理2015 Natural Language Processing 2015
呂 雷寧 RO, Rainei (上海財経大学 外語学院・ 常勤講師)
欅田 雄輝 S 北陸先端科学技術大学院大学 知識科学研究科
欠陥検出を目的とした類似コード検索法 吉田則裕,石尾隆,松下誠,井上克郎 大阪大学 大学院情報科学研究科
並列構造に着目した係り受け解析の改善に関する研究
ソフトウェア理解支援を目的とした 辞書の作成法
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
形態素解析と構文解析 金子邦彦.
自然言語処理2016 Natural Language Processing 2016
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
識別子の読解を目的とした名詞辞書の作成方法の一試案
2012年度 情報数理 ~ 授業紹介 ~.
Presentation transcript:

シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム 堂腰裕明 小山聡 栗原正仁 (北海道大学大学院情報科学研究科)  近年の,コンピュータの能力の進化や応用の拡大に伴い,人とコンピュータをつなぐインタフェースも,より高度なものや扱いやすいものなど,幅広く求められるようになっている.  そのインタフェースの多機能化の方向の一つとして,人間の感情の情報を利用しようというものがある.コンピュータによる人間の感情情報の読み取りや,コンピュータからの感情情報の発露など,感情の情報にはさまざまな利用法が考えられる.  本手法では,文章とその受信者の感情に焦点を当てる.具体的には,小説文章からの感情移入などを想定する.小説文章に人間がどのように感情移入し,自身の感情へと反映させるかを推測するため,その前段階として、文章表現が単純で易しめな類の文章を童話文と定義し,それら童話文での登場人物の感情を推測する. 研究背景と目的  本手法では,シソーラス情報として日本語Wordnetを利用した.日本語Wordnetでは,単語をsynsetと呼ばれる同義語のグループに分類しており,このsynsetごとに簡単な意味を付加し,それぞれのsynset同士の関係を記述している.synsetごとの関係としては,上位語,下位語などがある. 大規模シソーラスについて joy (嬉しさ) emotion (情感) feeling (感) state (動静) 上位語 synset構造の例 synset: joy(嬉しさ) 喜び、歓び、悦楽、楽しさ、愉悦… 提案手法 前処理 与えられた小説文章 形態素解析および係り受け解析・主語を判別 文1:おじいさん 文2:おとうさん 文3:近所のおじさん 文章ごとに主語を判別 登場人物ごとにそれぞれの場面の感情を推測 各文ごとに感情を示す語を判別 悲しい… 楽しい! 嬉しい! 1.対象となる文章への前処理  本手法で用いる小説文章は,「青空文庫」内で「児童書」とカテゴライズされた中で,「文学」の分野とされたものに対して,読解の敷居を下げるためにいくつかの前処理をしたものを用いる.前処理とは以下の四点である. 主語が曖昧な場合に補う 平仮名を自然な程度に漢字に直す 時系列がバラバラな場合正しく直す 登場人物のリストを予め与える 2.一文ごとに主語を判別  文章を係り受け解析し,さらに以下のような処理を行うことで,一文ごとに主語を判別する. 3.感情を示す語を判別  文章中の各語が属するsynsetに関して,上位語をたどる.  このとき,名詞においてはemotion(情感)やfeeling(感)のsynsetが上位語に発見できる語を,感情を示している語とする.同様に動詞については,feel(感じる)やexperience(感じる)を上位語に探す.  そうして,感情を表しているとされた語を判別することで,各文について,それぞれ対応する登場人物がどのような感情でいるか推測する. 1.句点を持つ文節を主たる述語とする 2.述語文節に係る文節を主語候補とする 3.主語候補の中から、格助詞「は」や   「が」を見つける 4.格助詞「は」「が」を持つ主語候補の   中で,述語に係るものを主語と判定  「おおかみと七ひきの子やぎ」について,全体を十一の場面に分割し,提案手法を用いて,各場面における登場人物の感情をそれぞれ推測した.  また,大学生及び大学院生計九名に,十一の場面に分割した小説文章を読んで,同様に場面ごとの登場人物の感情を推測してもらい,提案手法がどれだけ人間の感性と近い結果を出せているか検証した.  推測する感情については,「喜び」「悲しみ」「怒り」「楽しさ」の四つに,判断不能という意味での「無」を加えた五つのうち,どれにあてはまるかという形で判定した. 実験  右図が実験の結果である.黒字が人間の推測した場面ごとの登場人物の感情であり,横のパーセンテージが,実験者のうちどれだけがその感情を推測したかを示している.赤字がシステムの出力である.  システムが拾い切れなかった感情については,このシステムが直接的に感情を示す語にのみ反応し,文脈などで間接的に示している部分を見逃しているためと思われる.  また、「喜び」以外の感情の反応の弱さに関して,日本語Wordnet内に収録されている語や,実験に用いた文章内の語が,必ずしも上位語にたどり着いていない場合が考えられる. 結果と考察 出力結果一覧