形態素解析および係り受け解析・主語を判別

Slides:



Advertisements
Similar presentations
英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.
Advertisements

言語情報を利用したテキストマイニ ング 奈良先端科学技術大学院大学 情報科学研究科 工藤 拓 山本 薫 坪井 裕太 松本 裕治.
著作権管理のための 関係の地図の記述について 200702887 市川 俊介. 研究背景 コンピューターやネットワーク機器の開発に より、文書や図面をネットワーク上で公開し たりすることが多くなる。 どんな著作物があるのかを知らずに公開し、 著作権を侵害したとされる例もあり、そのよ うな問題をどうすれば防ぐことができるのか.
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
システム開発におけるユーザ要求の 明示的表現に関する一検討
顔表情クラスタリングによる 映像コンテンツへのタギング
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
最大エントロピーモデルに基づく形態素解析と辞書による影響
構造的類似文検索アルゴリズムを応用した日本語文型パターン抽出法
ヘルスケア連動型 市販薬検索システム 研究者 : 加納 えり 指導教員 : 越田 高志.
形態素周辺確率を用いた 分かち書きの一般化とその応用
言語体系とコンピュータ 第5回.
国内線で新千歳空港を利用している航空会社はどこですか?
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
東京工科大学 コンピュータサイエンス学部 亀田弘之
動詞と格要素の共起と 名詞の出現パターンを用いた 事態性名詞の項構造解析
テキストマイニング, データマイニングと 社会活動のトレース
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
4Y-4 印象に残りやすい日本語パスワードの合成法
顔表情認識のための顔特徴点抽出 徳島大学 大学院 工学研究科 長野 信男.
DixChange プロジェクト ~辞書共通化の試み~
セマンティクスを利用した 図書検索システム
メソッド名とその周辺の識別子の 相関ルールに基づくメソッド名変更支援手法
1DS04169K 太田睦美 1DS04185K 高田将平 1DS04206E 森根光春
日本語解析済みコーパス管理ツール 「茶器」
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
1月19日 辞書 自然言語処理における辞書の役割 機械辞書設計の要点 辞書の種類と用途.
平成22年6月15日 図書系職員のための アプリケーション開発講習会
検索エンジンを利用した Covert Channelの検出
オントロジーを使用した プログラム開発支援システムの提案
自然言語処理及び実習 第11回 形態素解析.
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
思考支援ツールを用いた 情報処理技術知識の学習方式
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
東京大学OPAC Plus “言選Web” -関連学術用語による日本語文献情報への 簡易ナビゲーションシステム-
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
自然言語処理2016 -平成28年11月7日・14日(No.6&7)-
データ工学特論 第六回 木村昌臣.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
移動エントロピーによる 動的ネットワーク化を用いた SNSと商品購買の相互関係の分析
ユビコン環境構築のためのソフトウェアプラットフォーム ユビコン環境における化身話利用の可能性
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
テキストマイニング, データマイニングと 社会活動のトレース
知能情報システム特論 Introduction
東京工科大学 コンピュータサイエンス学部 亀田弘之
超大規模ウェブコーパスを用いた 分布類似度計算
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
東京工科大学 コンピュータサイエンス学部 亀田弘之
資料2-2 平成26年度 第2回技術委員会資料 次年度検討テーマ案
シソーラスとは? ①文章作成用の類義語辞典 → 普通に書店に売っている。 『日本語大シソーラス』 (大修館書店) など。
構造的類似性を持つ半構造化文書における頻度分析
セマンティックWebの 生産管理システムへの適用
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
コーパス コーパス(Corpus)はコンピュータの発達とともに、計算機可読なデータを容易に作成・収集することができるようになったことがその背景にある。現在ではコーパス言語学などの学問もある。
大規模コーパスに基づく同義語・多義語処理
自然言語処理2015 Natural Language Processing 2015
並列構造に着目した係り受け解析の改善に関する研究
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
セマンティックWebの 生産管理システムへの適用
形態素解析と構文解析 金子邦彦.
自然言語処理2016 Natural Language Processing 2016
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
東京工科大学 コンピュータサイエンス学部 亀田弘之
Presentation transcript:

形態素解析および係り受け解析・主語を判別 Webマイニングを用いた 文章中の行為者及び被行為者の感情推定 研究背景と目的  近年の,コンピュータの能力の進化や応用の拡大に伴い,人とコンピュータをつなぐインタフェースも,より高度なものや扱いやすいものなど,幅広く求められるようになっている.  そのインタフェースの多機能化の方向の一つとして,人間の感情の情報を利用しようというものがある.コンピュータによる人間の感情情報の読み取りや,コンピュータからの感情情報の発露など,感情の情報にはさまざまな利用法が考えられる.  本手法では,文章とその受信者の感情に焦点を当てる.具体的には,小説文章からの感情移入などを想定する.小説文章に人間がどのように感情移入し,自身の感情へと反映させるかを推測するため,その前段階として,文章表現が単純で易しめな類の文章を童話文と定義し,それら童話文での登場人物の感情を推測する. これまでの研究 登場人物ごとに感情を推測 小説文章      前処理を行った文章 文ごとに主語を判別 嬉しい! 文1:おじいさんは踊っている 文2:おとうさんはテレビを見て笑っている 楽しい! 前処理 形態素解析および係り受け解析・主語を判別 各文ごとに感情を示す語を判別 対象となる文章への前処理  「青空文庫」内で「児童書」の「文学」とカテゴライズされたものに対して,以下の四つの前処理をしたものを用いる. 主語が曖昧な場合に補う 平仮名を自然な程度に漢字に直す 時系列がバラバラな場合正しく直す 登場人物のリストを予め与える 一文ごとに主語を判別  文章を係り受け解析し,さらに一文ごとに主語を判別する. 感情を示す語を判別  文章中の各語に関して,公開シソーラス日本語WordNetを用いて上位語をたどる.  このとき,名詞動詞それぞれにおいて,上位語に特定の概念が存在している場合,その語は感情を表しているものとする.(例:上位語に「情」や「感情」が存在するなど)  そうして,感情を表しているとされた語を判別することで,各文について,それぞれ対応する登場人物がどのような感情でいるか推測する. 1.句点を持つ文節を主たる述語とする 2.述語文節に係る文節を主語候補とする 3.主語候補の中から,格助詞「は」や   「が」を見つける 4.格助詞「は」「が」を持つ主語候補の   中で,述語に係るものを主語と判定 提案手法 ML-Ask  文章中の登場人物の感情推定をより効率よく行うための手段の一つとして,ある動詞一つから,その行為者のみならず被行為者の感情も推定するという手法を提案したい。  近現代の作家の文章表現を「喜・怒・哀・怖・恥・好・厭・昂・安・驚」の10種類の感情に分類した『感情表現辞典』を利用して,これら10種の感情についての表現集としてまとめたデータベースであり、各感情についての語彙や表現が記述されている。  『感情表現辞典』そのものが日本語の言語表現を基にしたものであり,このデータベースもそれを志向している. 怒る 怒られる ML-Ask ML-Ask内の表現とand検索 データベース化 叩く 叩かれる