動詞の共起パターンを用いた 動作性名詞の述語項構造解析

Slides:



Advertisements
Similar presentations
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
テキストデータベースからの 構文構造のマイニング
最大エントロピーモデルに基づく形態素解析と辞書による影響
人工知能特論 8.教師あり学習と教師なし学習
「わかりやすいパターン認識」 第1章:パターン認識とは
言語モデル(200億文のGoogle日本語Nグラムから計算)
言語体系とコンピュータ 第5回.
国内線で新千歳空港を利用している航空会社はどこですか?
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
共起用例と名詞の出現パターンを用いた動作性名詞の項構造解析
情報とコンピュータ 静岡大学工学部 安藤和敏
東京工科大学 コンピュータサイエンス学部 亀田弘之
動詞と格要素の共起と 名詞の出現パターンを用いた 事態性名詞の項構造解析
芦田尚美*,髙田雅美*,木目沢司†,城和貴* *奈良女子大学大学院 †国立国会図書館
テキストマイニング, データマイニングと 社会活動のトレース
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
まずオープンソース開発者に対する支援から!
事態性名詞の項構造解析に向けた 述語項構造に関する資源の作成
重文・複文の基本文型に対する 文型パターン辞書のカバー率
述語項構造に基づいた統計 翻訳における語句の並べ替え
形態素解析および係り受け解析・主語を判別
SGMLについて 2年8組  原口 文晃.
個体記述型・事態記述型・理由供給型の違いについて
日本語解析済みコーパス管理ツール 「茶器」
大規模時系列ウェブコーパスを用いた 新造語の盛衰のダイナミズムの分析
検索エンジンを利用した Covert Channelの検出
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
複数の言語情報を用いたCRFによる音声認識誤りの検出
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
Entity-Centricな述語項構造解析・ 共参照解析の同時学習
奈良先端科学技術大学院大学 小町守 mamoru-k@is.naist.jp
機械翻訳勉強会 NTCIR-7について 2007年10月16日 奈良先端大D1小町守.
大規模データによる未知語処理を統合したスケーラブルな仮名漢字変換
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
プログラム動作理解支援を目的とした オブジェクトの振舞いの同値分割手法
形態素解析ドライバモデルの実装と コーパスの品詞体系変換への応用
シナリオのアニメーション表示による 妥当性確認支援
テキストマイニング, データマイニングと 社会活動のトレース
環境システム科学演習(後半) FORTRAN & C(以降FORTRANと省略して呼びます)は富士通
東京工科大学 コンピュータサイエンス学部 亀田弘之
超大規模ウェブコーパスを用いた 分布類似度計算
東京工科大学 コンピュータサイエンス学部 亀田弘之
意味・談話解析勉強会 チュートリアル 小町守.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
AdaBoostを用いた システムへの問い合わせと雑談の判別
ブースティングとキーワードフィルタリング によるシステム要求検出
構造的類似性を持つ半構造化文書における頻度分析
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
コーパス コーパス(Corpus)はコンピュータの発達とともに、計算機可読なデータを容易に作成・収集することができるようになったことがその背景にある。現在ではコーパス言語学などの学問もある。
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
大規模コーパスに基づく同義語・多義語処理
自然言語処理2015 Natural Language Processing 2015
奈良先端科学技術大学院大学 小町守 mamoru-k@is.naist.jp
並列構造に着目した係り受け解析の改善に関する研究
情報とコンピュータ 静岡大学工学部 安藤和敏
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
バイオインフォマティクスII 遺伝子発現データの AdaBoostによる判別
情報とコンピュータ 静岡大学工学部 安藤和敏
形態素解析と構文解析 金子邦彦.
自然言語処理2016 Natural Language Processing 2016
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
識別子の読解を目的とした名詞辞書の作成方法の一試案
東京工科大学 コンピュータサイエンス学部 亀田弘之
Presentation transcript:

動詞の共起パターンを用いた 動作性名詞の述語項構造解析 小町守 自然言語処理学講座 奈良先端科学技術大学院大学 mamoru-k@is.naist.jp 2005年11月11日

研究背景 事態構造の把握 今日のゼミナール発表の準備大変だったよ なにを発表したの? 大変(だ) [theme: 準備] 項 ←意味役割付与というテーマで研究されている 述語 大変(だ)  [theme: 準備] 述語項構造 発表(する) [agent: 話し手, theme: φ] 動作性名詞 ←研究されていない 準備(する) [agent: 話し手, theme: 発表] 事態構造 2005年11月11日

研究目的 事態構造の把握に必要な技術の研究 事態構造を用いたアプリケーションの開発 述語項構造解析 機械翻訳 QAシステム 動詞の述語項構造解析 動作性名詞の項構造解析 事態構造を用いたアプリケーションの開発 機械翻訳 QAシステム 自然な対話システム 2005年11月11日

愛知県でボデーカラーが白の展示車を見られる所を教えて。 動詞の述語項構造解析 動詞(述語)と主語・目的語など(項)との関係を解析 愛知県でボデーカラーが白の展示車を見られる所を教えて。 教える [agent: 聞き手, theme:所, beneficiary: 話し手] 見る [agent: 話し手, theme:展示車] 白(だ) [theme:ボデーカラー] それぞれの項がなんらかの役割(意味役割)を持つ 2005年11月11日

動作性名詞の項構造解析 動作性名詞について動詞同様項関係を解析 運転中に電話1がかかって来たときに電話2のマークで電話3をとることができるか? 電話1 [agent: (この文だけでは分からない)] 電話2 モノとしての電話 名詞によっては述語項構造を持つ場合も持たない場合もあり、文字だけでは判断できない 電話3 [agent: 話し手] 2005年11月11日

動作性名詞の項構造解析に必要なもの タグつきコーパス 動作性名詞の述語項構造の辞書 動作性名詞の項構造解析用の情報を付与 進捗:約1,200文書(4,000文)に対してタグづけ済み 動作性名詞の述語項構造の辞書 動作性名詞がとる項のパターンを記述 進捗:未着手 2005年11月11日

動作性名詞の項構造解析の実験 目的:動作性名詞が事態性を持つかどうか、動詞の共起パターンを用いて述語項構造を決定しながら判定できるかどうか調べる 評価事例:新聞記事約200記事 新聞記事に出てきた動作性名詞中の約2,000語 方法:EDR辞書の動詞の共起パターンを用いて動作性名詞の事態性を学習し、Support Vector Machinesを用いて分類(10分割交差検定) 2005年11月11日

共起パターンと名詞の述語項構造 動詞の共起パターン:動詞がどのような項を伴うか(どのような名詞と一緒に現れるか) 動作性名詞の近辺に出現する名詞が動作性名詞の共起パターン(項)とどれだけ類似しているか 近い? ◎ 近い? △ リセット(する) [agent: 人間] [object: 器具] 何とかしてトリップメーターのリセット1とエネルギー回収率表示のリセット2を連動しないようにする方法はないのか。 似ている? ○ 共起パターン 似ている? △ 近い? ◎ リセット1(する) [agent: (話し手), object: メーター] リセット2(する) [agent: (話し手), object: 表示] 2005年11月11日

動作性名詞の事態性と共起パターン 精度 再現率 共起パターンなし 80.08% 89.66% 共起パターンあり 80.67% 89.81% 精度=事態性があると分類された動作性名詞のうち正解数 再現率=動作性名詞のうち事態性を正しく判定できた数 動作性名詞2,179個 うち1,436個が事態性ありの事例(65.90%) 2005年11月11日

動作性名詞の事態性判定の分析 動詞の共起パターンを用いても動作性名詞の事態性の判定精度にあまり差がない 項があまり当たっていないせい? 項を持つ動作性名詞1,436個中項がなにか正しく当てられたのは235個(16.36%) 動詞の共起パターンは動作性名詞の項構造解析にはあまり関係ない? 2005年11月11日

項が当たらなかった例 「子供が抱く、知らないことへの興味、関心は、僕たちの時代と変わらない。『理科離れ』ではなくて、理科教育のあり方、特に試験が嫌われているんです」 正解 教育 [ agent: (この文だけでは分からない), object: 理科 ] 解析 教育 [ agent: なし, object: なし ] 理由 動詞の共起パターンによると「教育する」の object は「人間」か「組織」のみ 省略された項はテキストに現れないので当てられない 2005年11月11日

今後の予定 事態性の判定にはなにが有効か探る 述語項構造の有無は分かっているものとして実際に項がどれくらい当てられるか 動作性名詞の項構造解析の判定精度を上げる 述語項構造の有無は分かっているものとして実際に項がどれくらい当てられるか 動作性名詞の述語項構造の辞書作成 2005年11月11日