身内敬語意識の変化予測 A Statistical Analysis of OSH III by a Psychological Model OSH: Okazaki Survey of Honorifics 言語情報科学特別講義1 「言語の認知・記憶・習得に関する計量的研究法」の第4回 2012年11月9日.

Slides:



Advertisements
Similar presentations
Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:
Advertisements

1 地域社会の共通語化に関する 多変量解析モデル 情報処理学会 第 85 回 人文科学とコンピュータ研究会( CH-85 ) 2010 年 2 月 6 日(琉球大学) 横山詔一 * ・阿部貴人 * ( * 国立国語研究所)
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
春の計量経済学勉強会 第1回:2016年2月23日(火) 市野泰和. 研究! ・ ・ ・研究?
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
心理測定論 信号検出理論.
数理統計学  第9回 西山.
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
横山詔一*・朝日祥之*・真田治子** *大学共同利用機関法人・国立国語研究所 **埼玉学園大学
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
入門 計量経済学 第02回 ―本日の講義― ・マクロ経済理論(消費関数を中心として) ・経済データの取得(分析準備) ・消費関数の推定
シミュレーション論Ⅰ 第6回 待ち行列のシミュレーション.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
英語特別講座 疑問文 #1    英語特別講座 2011 疑問文.
第十七か ぐちとうわさ話.
間接疑問文 I know him. I know (that) he is a doctor. ↓ why he is a doctor.
日本語... ジェパディー! This is a template for you to use in your classroom.
Recognise, ask about and talk about purpose
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
横山詔一*・松田謙次郎**・朝日祥之* (*国立国語研究所,**神戸松蔭女子学院大学)
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
地震長期予測地図のデザイン改善 によるリスクコミュニケーション効果の検討
じょし Particles.
社会心理学のStudy -集団を媒介とする適応- (仮)
因果関係3原則 2009年月曜日・3時限 社会理論と調査法.
統計学 10/19 鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
統計リテラシー育成のための数学の指導方法に関する実践的研究
On / in / at Honoka Tanno.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
春の統計学・計量経済学勉強会 第1回:2017年2月21日(火) 市野泰和
離婚が出生数に与える影響 -都道府県データを用いた計量分析
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
シミュレーション論 Ⅱ 第15回 まとめ.
市場規模の予測.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
トレーニング プレゼンテーションのタイトル
数量分析 第2回 データ解析技法とソフトウェア
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場規模の予測.
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
理論研究:言語文化研究 担当:細川英雄.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
北大MMCセミナー 第62回 附属社会創造数学センター主催 Date: 2016年11月4日(金) 16:30~18:00
ベイズ最適化 Bayesian Optimization BO
シミュレーション論 Ⅱ 第1回.
クロス表とχ2検定.
The difference between adjectives and adverbs
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
構造的類似性を持つ半構造化文書における頻度分析
数理統計学 西 山.
Indirect speech Toshiyuki Naka.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
疫学概論 方法論的問題点(患者対照研究) Lesson 13. 患者対照研究 §B. 方法論的問題点 S.Harano,MD,PhD,MPH.
2011 行動分析学特論 (1)行動分析学と 対人援助(学)
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
回帰分析入門 経済データ解析 2011年度.
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
Indirect Speech 間接話法 Kaho.I.
Elements of Style 第3回 2019年6月11日(火).
Presentation transcript:

身内敬語意識の変化予測 A Statistical Analysis of OSH III by a Psychological Model OSH: Okazaki Survey of Honorifics 言語情報科学特別講義1 「言語の認知・記憶・習得に関する計量的研究法」の第4回 2012年11月9日 きょうの添付資料は 横山・朝日・真田(2009)『社会言語科学』論文(社会言語科学会査読誌) Altmann, G., von Buttlar, H., Rott, W., & Strauss, U. (1983). A Law of Change in Language. In Brainerd, B. (Ed.), Historical Linguistics. (Quantitative Linguistics. Vol.18). pp. 104-115. Bochum: Studienverlag Dr. N. Brockmeyer. 横山詔一(国立国語研究所) yokoyama@ninjal.ac.jp

この研究の目的は? 本研究は,愛知県岡崎市で1953年,1972年,2008年に国立国語研究所が実施した敬語調査(以下,岡崎調査)の新たな意義について考える。 研究者のこれまでの関心は,おもに,地域社会における言語生活の実態記述(記録)にあった。 約50年間にわたって蓄積された言語変化データを別の角度からながめることで,言語習得研究のほか,脳科学や加齢医学など言語学以外の分野にも寄与できる知見を見いだせるかも。

岡崎市とは? 愛知県に位置する 調査地域の人口  約6万人(2008)  cf. 市全体では30万人 徳川家康の生誕地 3

徳川家康公の生誕地:岡崎城のいま

Example(1) ‘house call’ Q. Your neighbour suddenly became ill, and (s)he needs a medication. You were asked to go to the hospital. Doctor like one on the picture showed up in front of you. What would you say to ask him to come over to your neighbour’s house?

岡崎調査の調査デザイン 「コーホート系列法(cohort sequential method)」と呼ばれている。

第1回調査(1953)の写真:調査者は柴田 武氏

突然で恐縮ですが・・・「社会脳(Social brain)仮説」とは 人間どうしが,うまくやっていくための社会的能力をコントロールする特定の部位が,脳内にあるという説。 その特定部位が果たす役割は二つ。 一つは「周りの人がいまどう感じているかとか,いま何をしたいと思っているかという情報をうまくキャッチすること」。 もう一つは「集めた情報をもとに社会の中で実際に適切に振る舞うこと」(村井俊哉,2007)。 → 敬語の運用とも関係がありそうな話・・・

縦断(実時間経年)調査と社会脳仮説のコラボ たとえば,愛知県岡崎市で縦断的(経年的)に実施された敬語調査のグラフには,岡崎市民の脳内に蓄積・記憶されている言語的記憶の平均像に関する経年変化が投影されている,と考えてみてはどうだろうか。 これは,ある地域社会の話者集団における(語用論的な)記憶装置としてのレキシコンに関する仮説であるから,これからは新たに「社会的レキシコン(Social lexicon)仮説」と呼ぶ。 レキシコンの生涯変化に関するデータは,加齢(aging)による認知症(dementia)や失語症(aphasia)の医学研究にも有用な知見を与える可能性が期待される。

映画『晩春』(小津安二郎監督):娘は父親に敬語を使う。 ここで文献を配布: 横山・朝日・真田(2008) 愛知県岡崎市での半世紀以上にわたる縦断調査。 レキシコン固定説が正しいのであれば,言語変化のカーブは一本につながるはず。 質問項目207(身内敬語意識を調べる質問) 「家の中でも,年上の人や目上の人には敬語を使わなければならないでしょうか。それとも家の中では使わなくてもいいでしょうか。」  使うべきだ/時や場所や相手による/使わなくてもいい 映画『晩春』(小津安二郎監督):娘は父親に敬語を使う。 さて,岡崎調査の結果は・・・ まずは,過去2回調査の結果と,第3次調査の予測を示そう。

「207 家の中でも,年上の人や目上の人には敬語を使わなければならないでしょうか.それとも家の中では使わなくてもいいでしょうか」 表1 1953年と1972年の調査データ

Year of the birth Probability Observed 1953 1972 ※このグラフの謎 生年は臨界期の時期を決める。 臨界期を新しい時代で過ごした 人ほど身内敬語意識はうすくなる ようだ。 では調査年は何に影響するのか? Fig.1. The observed probability with which respondents said that honorifics shoul be used towards the oldest or senior family members at home in 1953 and 1972.

生年は臨界期の時期を決める。 (同じ生年だと同じ時期に臨界期を迎える。) では調査実施年は? 現実社会 心内辞書 接触して聞く頻度 社会的使用頻度 記憶痕跡 【生年に依存】 臨界期記憶 他者に配慮した 言語表現の選択 【調査年に依存】 加齢効果 + 時代効果 好み(選好) なじみ(親近度) 単純接触効果

敬語意識の変化をロジスティック回帰モデルで予測。 log [p/ (1ーp) ]=a1×生年+a2×調査年+b 現実社会 心内辞書 接触して聞く頻度 社会的使用頻度 記憶痕跡 臨界期記憶 他者に配慮した 言語表現の選択 加齢効果 + 時代効果 好み(選好) なじみ(親近度) 単純接触効果

身内敬語意識データはレキシコン変化説を支持 横山詔一・朝日祥之・真田治子(2008)は,過去2回の調査データを解析し, 第3次調査の結果を予測。 生年が同じ調査対象者集団なのに,経年調査の回答傾向は重ならない。 数量的な予測に用いた変数は「生年」と「調査年」の2つ。 多変量S字カーブによる理論的な予測値が「落ち込み現象」をうまくとらえていることが明らかになった。 図4 身内敬語意識の変化予測 タテ軸は「身内でも敬語は使うべきだ」の 回答確率【横山・朝日・真田(2008)より】

第3次調査の結果は・・・ Probability Year of the birth 図5 第3次調査の結果 Observed Predicted 1953 2006 Theory Web 1972 2008 図5 第3次調査の結果 タテ軸は「家の中でも敬語は使うべきだ」の 回答確率【横山詔一・朝日祥之(2010)より】

ここまではモデルの解説でした。 そろそろロジスティック回帰分析の説明を始めましょう。 ここで文献を配布: 言語変化のS字カーブに関する海外の研究状況は? ☆ ヨーロッパ(ロシアやドイツ)に先行研究がある。 Altmann, G., von Buttlar, H., Rott, W., & Strauss, U. (1983). A Law of Change in Language. In Brainerd, B. (Ed.), Historical Linguistics. (Quantitative Linguistics. Vol.18). pp. 104-115. Bochum: Studienverlag Dr. N. Brockmeyer. → ミジンコなどの増殖過程の微分方程式モデルをヒントにしたものか? *きょうの講義は上記とは別の説明を二つ紹介する

言語変化はS字カーブを描くことが多い。なぜS字カーブになるのか? 仮説1「革新派,中間派,保守派の人数勢力は正規分布しているから」 身長測定データをヒストグラム(度数分布図)で示したのが上の図 度数を身長の低い区分から累積していくとS字カーブになる

言語変化のS字カーブ理論: 正規分布(Bell curve)説 マーケティング研究などの分野で有名なChasm理論 この世には新しいモノが好きな人と,そうでもない人が一定の割合で存在 キャズムの意味は「溝」とか「裂け目」のこと キャズムを越えると,一気に普及が進む 新製品の採用がイノベーターから始まって時間経過とともに右側の群にも拡大する場合 普及率(%)をイノベーターからラガード方向に累積していくと => 次のスライド

言語変化のS字カーブ理論: 正規分布(Bell curve)説

仮説2「ポテンシャルが顕在化する際は正規分布にしたがうユレを伴うから」 下はロジスティック回帰分析の模式図(横山・真田,2008) 仮説2「ポテンシャルが顕在化する際は正規分布にしたがうユレを伴うから」   下はロジスティック回帰分析の模式図(横山・真田,2008) ヨコ軸が身内敬語意識にかかわる要因: 生年など タテ軸は「身内でも敬語を使うべき」を選択させるポテンシャル「Z」 影のついた面積が「身内でも敬語を使うべき」の選択確率 p → S字カーブに

☆ ポイントは,影のついた部分の面積をどうやって求めるかにある 次のスライドに示す式(2)により,正規分布(ただし標準偏差1.7で,平均0)の影のついた部分の面積 pを近似的に計算できることをLord & Novick(1968)が証明。 この発見でテスト理論(項目反応理論)は大きく発展。TOEFLなどに活用。

Equation(1) is a logistic regression analysis. log [ p / (1 − p) ] = Z (1) Z = a1 x1 + ∙ ∙ ∙ + an xn + b This equation can be transformed to p = 1 / [ 1 + exp ( − Z ) ] (2) log is the logarithm of base e. p / ( 1-p ) is called odds. log [ p / (1 − p) ] is called logit.

【目標】 次に示す表1と表2のデータから以下のようなグラフを描くこと 【目標】 次に示す表1と表2のデータから以下のようなグラフを描くこと

「207 家の中でも,年上の人や目上の人には敬語を使わなければならないでしょうか.それとも家の中では使わなくてもいいでしょうか」 表1 1953年と1972年の調査データ

表2 2006年に実施したWeb調査データ(数値は%) 「207 家の中でも,年上の人や目上の人には敬語を使わなければならないでしょうか.それとも家の中では使わなくてもいいでしょうか」 表2 2006年に実施したWeb調査データ(数値は%)

Lieben und arbeiten. フロイト先生

メールで yokoyama@ninjal.ac.jp に ちなみに,ninjal を大文字で表記すると NINJAL です。 【ミニレポート課題】 言語変化の軌跡がS字カーブを描くことが多い理由について,きょうは二つの仮説を紹介しました。あなたは,どちらの仮説がより説得力がある(優れている)と判定しますか?200字以上800字以内で述べてください。 *提出期限    日本時間で11月11日(日)の正午【厳守】 *提出方法    メールで yokoyama@ninjal.ac.jp に    ちなみに,ninjal を大文字で表記すると NINJAL です。 *受取り確認について    メール送受信の事故を防止するため,横山から    11月12日(月)の17時までに受取りメールを出します。