言語学習・言語処理論 今井むつみ 慶應大学環境情報学部

Slides:



Advertisements
Similar presentations
第 23 課 花見の 人々は 楽しそうです 二 回 目. 1.助動詞そうだ:様態を表す 接続: § 形容詞語幹+そうだ ☆ない → なさそうだ ☆よい → よさそうだ § 形容動詞語幹+そうだ § 動詞Ⅰ連用形+そうだ.
Advertisements

大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
最大エントロピーモデルに基づく形態素解析と辞書による影響
ひでき 平成17年4月12日 「日本教」モデルを ネットワーク分析する ひでき 平成17年4月12日.
コーパス言語学実践 2006年度2学期 第10回.
001.「~っす」は敬語か? 2007年度国語学概説Ⅰ研究発表 野浪正隆.
富山大学教育学部 附属教育実践総合センター 助教授 小川 亮
メンタルレキシコンの学習:子どもはどのように単語の 意味を学習するか
国内線で新千歳空港を利用している航空会社はどこですか?
8 人間関係の中で育つ −社会性の発達−.
教育心理学 学習と認知プロセス 伊藤 崇 北海道大学大学院教育学研究院.
執筆者:市川伸一 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
一致の非対称の 極小理論的分析 小林 亜希子 島根大学 「言語と情報研究プロジェクト研究会:言語理論の動向を考える」 広島大学
伝統的件名標目の特徴 図書館界における統制語彙表。通常全分野型。 (1)統制語である 同義語の統制 例:絵、書画→絵画 警官→警察官
応用情報処理V 第1回 プログラミングとは何か 2004年9月27日.
CHAPTER1 UMLとオブジェクト指向の基本概念(2)
ことばの意味を類似語の対比とカテゴリーの境界から探る
マーケティング・リサーチ.
UMLの概要と オブジェクト指向の 基本概念
VI-7 連続分布(面データ)を分析する方法
協調機械システム論 (04.11, 04,本郷) 協調機械システム論 東京大学 人工物工学研究センター 淺間 一.
応用情報処理V 第1回 プログラミングとは何か 2003年9月29日.
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介.
メソッド名とその周辺の識別子の 相関ルールに基づくメソッド名変更支援手法
ことばの学習.
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
音韻論⑤ ----.
オントロジーを使用した プログラム開発支援システムの提案
言語学 語のかたち① pp
自然言語処理及び実習 第11回 形態素解析.
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
メンタルレキシコン3:ことばの意味を実験から探る
卒業研究中間発表 社会情報システム学講座 高橋義昭.
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
ICML2006勉強会 2006年7月29日 局所フィッシャー判別分析 東京工業大学 計算工学専攻 杉山 将.
この項は 『日本語構造伝達文法(05版)』 の第30章,第31章の内容に基づいています。より詳しくはその章をお読みください。
二重課題による ワーキングメモリの増減  情報システム工学科3年 038 田中 祐史.
第14章 モデルの結合 修士2年 山川佳洋.
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
ことばの学習.
言語学 語のかたち② p.p
Data Clustering: A Review
言語学習・言語処理論 今井むつみ 慶應大学環境情報学部
ことばの学習.
日本語統語論:構造構築と意味 No.8 連体修飾
第4章 社会構造概念はどのように豊穣化されるか
認知科学ワークショップ 第2回.
日本の高校における英語の授業は英語でがベストか?
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
知識表現 知識の表現形式 宣言的表現 手続き的表現 プロダクション・ルール フレーム 意味ネットワーク.
 型推論3(MLの多相型).
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
言語表現と 視覚表現の比較 関西大学社会学部 雨宮俊彦.
情報基礎Ⅱ (第1回) 月曜4限 担当:北川 晃.
構造的類似性を持つ半構造化文書における頻度分析
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理2015 Natural Language Processing 2015
デザイン行為における 思考プロセスの視覚化方法の提案: 時系列に着目した 単語の連想関係の結合
認知学習論 これからの教育と マルチメディア教育支援.
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
自然言語処理2016 Natural Language Processing 2016
感覚運動期(誕生~2歳) 第1段階 反射の修正(出生~約1ヶ月) 第2段階 第1次循環反応(約1ヶ月~4ヶ月)
識別子の読解を目的とした名詞辞書の作成方法の一試案
Elements of Style 第3回 2019年6月11日(火).
Presentation transcript:

言語学習・言語処理論 今井むつみ 慶應大学環境情報学部 2018/12/2 メンタルレキシコン         今井むつみ        慶應大学環境情報学部 2018/12/2

言語学習・言語処理論 今井むつみ 慶應大学環境情報学部 2018/12/2 ことば同士の結びつき         今井むつみ        慶應大学環境情報学部 2018/12/2

ことば同士の結びつき 二つのアプローチ (1)ことばは限られた数の普遍的な意味原素から成り立つ。似ていることば同士は共通の意味原素を持つ(古典的意味論と非常に似た考え方)→意味原素論(Decompositionist Theory) (2)ことばはそれぞれをひとつの単位と考える。ことばは複数の種類の結びつき方で結びついており、メンタルレキシコンは蜘蛛の巣のような意味ネットワークの構造をしている 2018/12/2

2018/12/2

意味原素論(1) 何が普遍的な意味原素なのか? シャンク Physical acts MOVE, INGEST, GRASP Mental CONC, MTRANS, ATRANS breath, drink, eat, inhale, sniff →INGESTを共通に持つ buy,sell,give, take, steal →ATRANSを共通に持つ 2018/12/2

意味原素論(2) ~意味原素論の問題点~ 「原素」がいくつなのか、一体何が原素なのかについて心理学的な根拠が希薄 このアプローチは主に限られた動詞のセットを扱う 他の種類のことばでの適用は難しい 例 空間関係を表す語は?  2018/12/2

意味原素論まとめ この考え方は辞書の記述(特にコンピュータ上での)に非常に便利。意味分析において必須。経済性の面からも望ましい。 しかし、古典的意味論と同様、普遍的原素が何かを特定することが非常に困難で、提唱された原素もその心的根拠はほとんどない。 2018/12/2

意味ネットワーク メンタルレキシコンの地図をつくれるか 語の連想 蝶 (butterfly) 空腹な (hungry) 赤 (red) 塩 (salt) 2018/12/2

2018/12/2

メンタルレキシコンの地図をつくれるか(1) 連想されやすい語 Co-ordination (同種の仲間) 塩→こしょう、蝶→蛾、赤→白、青etc. Collocation (共起しやすい語) 塩→水、蝶→網 2018/12/2

メンタルレキシコンの地図をつくれるか(2) Super-ordination (上位概念) 赤→色、蝶→昆虫 Synonymy (同義語) パーティー →宴会 2018/12/2

2018/12/2

Co-ordination のリンクがある証拠 人の言い間違い 右→左、昨日→明日、青→緑、兄→妹 似た語を一緒くたにしてしまうこともある I went to Noshville (Nashvill + Knoxville). I’d like some taquua (tequila + Kahlua). 2018/12/2

Co-ordinationのリンクの証拠から示唆されること(1) Co-ordinate の関係のリンクは非常に強い 言い間違いに見られる Co-ordinates の種類 対比  りんごーなし、赤ー黒、月曜ー火曜 反対  上ー下、太っているーやせている、男ー女 いとこ関係  土曜日ー1月(曜日名ー月名) 2018/12/2

Collocational link の証拠 star: stardust, starfish, starwars 失語症→ collocational link は良く保たれていることが多い bread → butter adolescent → rude イディオム→それ自体がひとつのまとまりとして処理される 2018/12/2

Super-ordination ~階層関係のリンク~ カテゴリーの多く→階層関係 コリンズとキリアン ‘A canary is a canary.’ ‘A canary is a bird.’ A canary is an animal.’ 2018/12/2

Super-ordination(2)~階層関係のリンク~ コリンズとキリアンに対して (1)頻度の問題→カナリアは動物より鳥といっしょに使われることが多い (2)「動物」は2つの使われ方をする 生き物全般 哺乳類あるいは4つ足の動物 2018/12/2

Super-ordination(3)~階層関係のリンク~ ‘A poodle is an animal.’ ‘A dog is an animal.’ → verification の時間に差がない 階層的な関係→同列の関係 (Co-ordination) ほど強い結びつきではない 階層的な結びつき→すべてのカテゴリーに同質にあるものではない → Wisniewski, Imai & Casey (1996) 2018/12/2

Super-ordination(4)~階層関係のリンク~ Wisniewski, Imai & Casey (1996) の実験 上位概念には2種類ある 階層関係によって結ばれている概念 (動物、乗り物、植物など) テーマ、空間的な共起関係によってまとまっている概念 (家具、キャンプ用品など) 2018/12/2

同義語 (Synonym) 非常に意味が近い(ほとんどの状況で交換可能)同義語については blending の言い間違いが起こる That’s torrible. (terrible, horrible) 少し意味が違うと起こりにくい chase / pursue → blending は起こらない     pursue →望ましいものを追いかける           知識、知恵、名声     chase →馬、犬、犯人 2018/12/2

ことばの品詞と意味ネットワーク ことばは意味ネットワークでは品詞(part of speech:動詞、名詞、形容詞など)ごとに分類されているのだろうか?  品詞の境界を超えた言い間違いはほとんどみられない 動詞、名詞、形容詞は言語普遍的なカテゴリー 文法クラスと意味カテゴリーは密接な関係 2018/12/2

ことばの品詞と意味ネットワーク(2) メンタルレキシコンではそれぞれのことばは品詞のタグづけがされ、ことばの文法的役割と意味はいっしょに表象されている →‘lema’ メンタルレキシコン内のことば同士のネットワーク構造の形は品詞によって異なる (ワードネットプロジェクト) http://wordnet.princeton.edu/ 2018/12/2

名詞クラスの構造 一般的な関係 階層関係 基礎レベル内のco-ordinatesの関係が特に重要 部分全体関係(meronomy) それぞれのエントリー(名詞)は「属性」を持つ 2018/12/2

動詞クラスの構造 多くの動詞は名詞のように上位、下位に関係づけられる 下のレベルにある動詞 →一般的に上のレベルのアクションの特定の仕方を表す ワードネットではこの関係を名詞の階層構造と区別してTroponymyと呼ぶ 2018/12/2

形容詞クラスの構造 二つのタイプ ascriptive (名詞の属性;一般的に1次元上で対概念があり、相対的な性質)  heavy vs. light, high vs. short, soft vs. hard pertainyms (名詞に付属する、あるいは関連する分野、場所などを表し名詞を限定する) musical cat, scientific discovery, mathematical genius 2018/12/2

形容詞と形容動詞 冷たい、柔らかい、赤い 静かな、おおらかな 2018/12/2

上位語(hypernym): すべてのXがYの種類の一であるならYはXの上位語である。 名詞 上位語(hypernym): すべてのXがYの種類の一であるならYはXの上位語である。 下位語(hyponym): すべてのYがXの種類の一であるならYはXの下位語である。 同族語(coordinate term): XとYがの上位語が同じなら、YはXの同族語である。 holonym: XがYの一部であるなら、YはXのholonymである。 meronym: YがXの一部であるなら、YはXのmeronymである。 動詞 上位語(hypernym): Xという行動がYの種類の一であるなら動詞Yは動詞Xの上位語である。 (「移動(movement)」は「旅行(travel)」の上位語) troponym: もしYという行動がXを行う際の様態であるなら動詞Yは動詞Xのtroponymである。(「片言で話す(lisp)」は「話す(talk)」のtroponym) entailment: Xしている場合必然的にYしているなら動詞Yは動詞Xにentail(ひきおこすこと)されている。 (X:「いびきをかく(snoring)」はY:眠る(sleeping)」ことによって引きおこされる。) 同族語(coordinate terms): XとYの上位語が同じなら、YはXの同族語である。 2018/12/2

名詞(自然物) Apple 名詞(人工物)refrigerator 動詞 Walk 形容詞 Beautiful 2018/12/2

ことばの意味を類似語の対比とカテゴリーの境界から探る 2018/12/2

持つ・運ぶ動作に関することばの意味 日本語 英語 中国語は? 持つ、抱える、抱く、背負う、担ぐ、支える Carry, hold 2018/12/2

2018/12/2

それぞれの動作にどの動詞を割り当てるか 手続き: 産出テスト:被験者はビデオを見て,刺激文に回答する 2018/12/2

それぞれの語の境界は? 13の語と13のビデオのすべての組み合わせをつくり、そのひとつひとつにYes, Noで反応してもらう これはna? これはding? これはbao? これはbei? 2018/12/2

子どもの理解する「意味」と大人の理解する「意味」は同じか、違うか 2018/12/2

2-2.実験概要:単純集計 大人(大学生)群 産出動詞 ビデオ 上手く使い分けられていれば対角線上に値が並ぶ 2018/12/2

2-2.実験概要:単純集計 3歳児 産出自体はしているものの,大きくばらついている 2018/12/2

3-1.分析①:相関分析 目的: 方法: 子どもの動詞の産出分布がどの様な過程を経て大人の産出分布へと近づいていくかを見る 年齢群毎にイベント間の相関行列を取り(各ベクトルの成分は動詞の産出頻度),更に行列ごとに年齢間で相関を取る 2018/12/2

3-1.分析①:相関分析 結果: 年齢を経る毎に,イベントに対する動詞の産出分布は線形に大人との相関を強める傾向がある しかし7歳児でも,大人との相関は0.6程度 産出することは出来ても,大人と同様に使うにはより時間がかかる 2018/12/2

5-1.予備⑥:個別MDS 3 years ADULT 2018/12/2

3-3.分析③:個人差MDS 結果:共通空間 ぬいぐるみ 手(指)が重要 容器 手以外の部分も重要 鞄 2018/12/2

3-3.分析③:個人差MDS 結果:個人空間 動詞を用いたイベント認知の特徴(軸に対する重み付け)が年齢間で異なる! 大人は軸1(手の重要さ)に対する感度が相対的に子どもよりも高く、子どもは軸2(オブジェクトの性質?)に対する感度が相対的に大人よりも高い 2018/12/2