ことばの意味を類似語の対比とカテゴリーの境界から探る

Slides:



Advertisements
Similar presentations
認知心理学 認知発達 今井むつみ. 問題提起 – なぜ発達を研究するのか – 子どもを対象にした認知研究は人間の認知に ついて何を教えてくれるか? – 人間の知識の源泉は何か? – 人間にとってもっとも自然な概念は何か? – 人間の「学習」とはどのようなものなのか? – 「学習」が可能なためには何を生得的にもっ.
Advertisements

だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
て形の作り方 How to make て form. There are 3 groups of verbs Group Ⅰ 70% のみます i とります i かいま す i.
VE 01 え form What is え form? え? You can do that many things with え form?
じしょけいのつくりかた 辞書形の作り方 How to make dictionary form. There are 3 groups of verbs Group Ⅰ 70% のみます i とります i かいま す i.
人工知能特論2011 No.4 東京工科大学大学院 担当教員:亀田弘之.
メンタルレキシコンの学習:子どもはどのように単語の 意味を学習するか
コーパス言語学実践 2006年度2学期 第10回.
英語学習についての信念 ―現職教員研修のための基礎研究
プログラミング言語としてのR 情報知能学科 白井 英俊.
メンタルレキシコンの学習:子どもはどのように単語の 意味を学習するか
英語特別講座 疑問文 #1    英語特別講座 2011 疑問文.
認知科学ワークショップ 第2回 記憶(1).
 辞書系(じしょけい).
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
関係代名詞 目的格の関係代名詞.
Verb Plain Negativeform
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
Paper from PVLDB vol.7 (To appear in VLDB 2014)
日本人の英語文章の中で「ENJOY」はどういうふうに使われているのか
Verb たform + ことがあります Past experience.
形容詞(2) けいようし.
テキストの類似度計算
V 03 I do NOT eat sushi. I do NOT do sumo.
I-Scoverチャレンジ2013 ~I-Scoverでできる こんなこと、あんなこと~ データ分析/可視化カテゴリ 論文キーワードの特徴分析 ~どんなキーワードを付けているのか~ GOMI Hiroshi.
日本語3 4月26日 漢字ゲス 出会い How do people meet? お見合いは何ですか?
十年生の 日本語 Year 10 Writing Portfolio
Licensing information
CRLA Project Assisting the Project of
ことばの意味を類似語の対比とカテゴリーの境界から探る
ことばの学習.
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
What is the English Lounge?
Isesaki City LEADER program Module 1
言語学習・言語処理論 今井むつみ 慶應大学環境情報学部
動詞の学習 動詞の語意の推論はどのように行われるのか.
東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当: 亀田 弘之
Photometric properties of Lyα emitters at z = 4
メンタルレキシコン3:ことばの意味を実験から探る
Bellwork: 1)宿題がたくさんあるのに、ゲームをしました。 2)大好きなのに、結婚ができません。
Traits 形質.
にほんご JPN101 Oct. 5, 2009 (Monday).
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
二重課題による ワーキングメモリの増減  情報システム工学科3年 038 田中 祐史.
第11回 継続的監査.
コードクローン検出ツールを用いた ソースコード分析システムの試作と プログラミング演習への適用
ことばの学習.
東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当: 亀田 弘之
G. Hanson et al. Phys. Rev. Lett. 35 (1975) 1609
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
フレアの非熱的成分とサイズ依存性    D1 政田洋平      速報@太陽雑誌会(10/24).
ことばの学習.
日本の高校における英語の授業は英語でがベストか?
Tag question Aoyama Shogo.
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
法数学のための 機械学習の基礎 京大(医) 統計遺伝学分野 山田 亮 2017/04/15.
The difference between adjectives and adverbs
Conflict of Interest disclosure slide A potential conflict of interest exists when there is involvement between the speaker/presenter with any for-profit.
Created by L. Whittingham
構造的類似性を持つ半構造化文書における頻度分析
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
(RHIC-PHENIX実験における粒子放出の方位角異方性の測定)
ポッツスピン型隠れ変数による画像領域分割
Grammar Point 2: Describing the locations of objects
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
感覚運動期(誕生~2歳) 第1段階 反射の修正(出生~約1ヶ月) 第2段階 第1次循環反応(約1ヶ月~4ヶ月)
Elements of Style 第3回 2019年6月11日(火).
Presentation transcript:

ことばの意味を類似語の対比とカテゴリーの境界から探る

ことばの意味の学習に含まれる プロセス 最初の語と意味のマッピング 最初のマッピングでの大まかな意味を再調整する 語と対象を結びつける おおまかな内包を推論する(語の指示するカテゴリーを推論する) 最初のマッピングでの大まかな意味を再調整する 語の意味は単独では決まらず、隣接する語との境界を調整する必要

初期の意味の再調整 新しい語を学ぶことによって、すでにレキシコンにある語の意味を再調整する

Haryu & Imai実験 3,4歳児対象に既知物に新しいラベルを付与、ラベルの拡張パターンを調べる 2つの実験条件 高類似群 低類似群 被験者のスクリーニング ターゲットを既知の基礎レベル名(ボール、スプーン)で呼んだ子供のみ本実験に参加

新奇ラベルの下位カテゴリーへのマッピング

新奇ラベルによる新カテゴリーの設立と既知カテゴリーの境界の修正

Haryu & Imai実験結果 子どもは新しい語を学習すると、その語の学習によってすでに知っている語の意味の再構造化(特に語の境界の再調整)を行うことができる もとの語の典型的なカテゴリーメンバーに新しい語   →もとの語の下位カテゴリーに新しい語をマッピング もとの語のあまり典型的でないメンバーに新しい語 →その対象をもとのカテゴリーから除外し、もとのカテゴリーの境界を狭める。新しい名前をもとのカテゴリーと対比の関係にあるカテゴリーにマッピング

隣接する語がたくさんある意味領域 では たくさんの語のあいだで語の境界を整理していかなければならないので、大人のように語を使い分けるのにはかなり時間がかかる 子どもはどのように同じ意味領域に属する類似の語の意味を整理し、ただしい(大人のような)意味を学んでいくのだろうか?

持つ・運ぶ動作に関することばの意味 日本語 持つ、抱える、抱く、背負う、担ぐ、支える 英語 Carry, hold 中国語は?

それぞれの動作にどの動詞を割り当てるか 手続き: 産出テスト:被験者はビデオを見て,刺激文に回答する

それぞれの語の境界は? 13の語と13のビデオのすべての組み合わせをつくり、そのひとつひとつにYes, Noで反応してもらう これはna? これはding? これはbao? これはbei?

子どもの理解する「意味」と大人の理解する「意味」は同じか、違うか

2-2.実験概要:単純集計 大人(大学生)群 産出動詞 ビデオ 上手く使い分けられていれば対角線上に値が並ぶ

2-2.実験概要:単純集計 3歳児 産出自体はしているものの,大きくばらついている

3-1.分析①:相関分析 目的: 方法: 子どもの動詞の産出分布がどの様な過程を経て大人の産出分布へと近づいていくかを見る 年齢群毎にイベント間の相関行列を取り(各ベクトルの成分は動詞の産出頻度),更に行列ごとに年齢間で相関を取る

3-1.分析①:相関分析 結果: 年齢を経る毎に,イベントに対する動詞の産出分布は線形に大人との相関を強める傾向がある しかし7歳児でも,大人との相関は0.6程度 産出することは出来ても,大人と同様に使うにはより時間がかかる

5-1.予備⑥:個別MDS 3 years ADULT

3-3.分析③:個人差MDS 結果:共通空間 ぬいぐるみ 手(指)が重要 容器 手以外の部分も重要 鞄

3-3.分析③:個人差MDS 結果:個人空間 動詞を用いたイベント認知の特徴(軸に対する重み付け)が年齢間で異なる! 大人は軸1(手の重要さ)に対する感度が相対的に子どもよりも高く、子どもは軸2(オブジェクトの性質?)に対する感度が相対的に大人よりも高い

3-2.Which verb can converge into adults’ use more easily? Method: Information Entropy Information entropy is adopted as an index of verb coverage. The broader a range of events a verb refers to, the higher value of entropy the verb receives. (Max: log213)

3-2.Which verb can converge into adults’ use more easily? Information entropy of 8 high frequent verbs Coverageについてもう少し深い解釈を 特に Na Basic level、動詞に関してはどうなの? 英語のキャリーホールドはアブストラクトレベルだけど、 境界線ははっきりしているから習得しやすいよ? 境界線をはっきりさせることが出来るか否かが重要だよね。 カウントマスも同じように考えることが出来る トレードオフの関係→境界線がはっきりしているか否かVSアブストラクトか否かが習得の困難さに影響している? 助数詞はどうか? →イントロで説明する Acquisitionはいろいろなレベルで語ることが出来ることを訴える For all verbs, the entropy value decreases from children to adults. The greatest contrast ->“ding” and “na” 24

3-3.What factor can predict the ease of learning verb well? Method: Multiple Regression Independent variables production frequency -> How frequently children produced the verb correlation with adults -> How well children’s use of the verb converge to adults’ use 25

3-3.What factor can predict the ease of learning verb well? Method: Multiple Regression Dependent variables Verb coverage Event ambiguity Corpus frequency(Beijing Language Institute,1986 ) Frequency Dictionary of Modern Chinese (Beijing Language Institute,1986) including1,200,000 words Event ambiguity Verb coverage 26

3-3.What factor can predict the ease of learning verb well? Model: independent variable: production frequency 3years 5years 7years Event ambiguity -.27 -.39 -.48* Corpus frequency .64* .60* .59* Verb coverage .42 .40 .49 Corpus frequency is significant for all the models: Higher corpus frequency->Higher production frequency Event ambiguity decreases from 3years to 7years(only that of 7years is significant). 27

3-3.What factor can predict the ease of learning verb well? Model: independent variable: degree of convergence with adults. 3years 5years 7years Event ambiguity -.73 * -.81* -86 * Corpus frequency .39 -.00 -.17 Verb coverage .09 .18 .19 Event ambiguity is significant for all the models: Higher ambiguity->Less convergence Corpus frequency decreases from 3years to 7years(not significant). 28

子どもはもっとも頻度が高く使われる動詞をもっともよく言う。しかし最初はその語を過剰に使用する。 他の語との境界の重なりが多い語ほど、おとなのような意味を学習するのに時間がかかる 他の語と重なる境界がない語は大人の意味を獲得するのが早い。 もっとも範囲が広く、過剰般用される語は、重なりがある複数の語との境界が整理されてはじめておとなの意味になる。つまり、初期にもっとも頻繁に使われ、過剰般用される語の学習にはもっとも時間がかかる