1 地域社会の共通語化に関する 多変量解析モデル 情報処理学会 第 85 回 人文科学とコンピュータ研究会( CH-85 ) 2010 年 2 月 6 日(琉球大学) 横山詔一 * ・阿部貴人 * ( * 国立国語研究所)

Slides:



Advertisements
Similar presentations
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
Advertisements

2006 年度 統計学講義内容 担当者 河田正樹
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
MBA 国際金融 外国為替市場の効率性. 2 効率的市場仮説 効率的市場( efficient market )とは? 為替相場が、為替相場に関連するすべての 利用可能な情報に即座に完全に反応。
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
第2章 なぜ発達心理学を学ぶのか? 道案内 1 準備 (0) 授業を始める前に * (1) 発達心理学とはどんな学問か? 2 知覚の発達 (3) 子供に世界はどう見えるか? 3 認知の発達 (4) 子どもはものごとをどう理解するか (5) 子どもは心をどう理解するか 4 感情の発達 (6) 子どもに愛情を注ぐこと.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
入門B・ミクロ基礎 (第4回) 第2章 2014年10月13日 2014/10/13.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
横山詔一*・朝日祥之*・真田治子** *大学共同利用機関法人・国立国語研究所 **埼玉学園大学
社会調査とは何か(3) 調査対象者の選定方法
小林盾(シカゴ大学) 大浦宏邦(帝京大学) 谷口尚子(帝京大学) 2004年9月19日 数理社会学会 山形大学
疫学概論 時系列研究 Lesson 11. 記述疫学 §B. 時系列研究 S.Harano,MD,PhD,MPH.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
パネル分析について 中村さやか.
Excelによる統計分析のための ワークシート開発
CCC DATAset における マルウェアの変遷
コメント 「ファセット・アプローチの 魅力とパワー」
第42回日本語教育学講座講演会 認知言語学からみた言語獲得 講師:谷口一美先生(京都大学大学院准教授) 入場無料
水利用者の行動変容に関する 調査・研究 熊本大学 地域公共政策研究室
パレスチナ人の越境移動に関する意識と経験
臨界期・刷り込み.
横山詔一*・松田謙次郎**・朝日祥之* (*国立国語研究所,**神戸松蔭女子学院大学)
実証分析の手順 経済データ解析 2011年度.
疫学概論 コウホート生命表 Lesson 7. 生命表 §A. コゥホート生命表 S.Harano,MD,PhD,MPH.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
小林盾(シカゴ大学) 大浦宏邦(帝京大学) 谷口尚子(帝京大学,ミシガン大学) 2004年11月21日 日本社会学会 熊本大学
分布の非正規性を利用した行動遺伝モデル開発
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
日本語統語論:構造構築と意味 No.1 統語論とは
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
大学での講義中の スマートフォンの私的使用 ―その頻度と内容-
統計リテラシー教育における 携帯端末の利用
6月26日 第9回発表 藤井 海太.
直接金融と間接金融 ~今後日本はどうなるか~
1時限で理解する 統計の基礎 応用情報処理II 2015/12/4 講師:新居雅行.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
第2章 なぜ発達心理学を学ぶのか?.
身内敬語意識の変化予測 A Statistical Analysis of OSH III by a Psychological Model OSH: Okazaki Survey of Honorifics 言語情報科学特別講義1 「言語の認知・記憶・習得に関する計量的研究法」の第4回 2012年11月9日.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
第3章 消費関数.
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
コードクローンに含まれるメソッド呼び出しの 変更度合の調査
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
多変量解析ゼミ 第10回 第12章クラスター分析 発表者 直江 宗紀.
数量分析 第2回 データ解析技法とソフトウェア
ソースコードの特徴量を用いた機械学習による メソッド抽出リファクタリング推薦手法
東京工科大学 コンピュータサイエンス学部 亀田弘之
日本の高校における英語の授業は英語でがベストか?
背景 課題 目的 手法 作業 期待 成果 有限体積法による汎用CFDにおける 流体構造連成解析ソルバーの計算効率の検証
シミュレーション論Ⅰ 第14回 シミュレーションの分析と検討.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「パレスチナ社会の民主主義的価値観」 報告のアウトライン はじめに 民主主義的価値観 仮説とデータ 検証1:パレスチナ社会における民主化の
クロス表とχ2検定.
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
データ解析 静岡大学工学部 安藤和敏
疫学概論 方法論的問題点(患者対照研究) Lesson 13. 患者対照研究 §B. 方法論的問題点 S.Harano,MD,PhD,MPH.
2011 行動分析学特論 (1)行動分析学と 対人援助(学)
テキスト理解,論点設定, 論述のスキルを高める アクティブ・ラーニング
Homogeneous model 相同モデル
厚生白書 人口減少社会の到来と少子化への対応 971221 波多野宏美.
議論の前提 ある人獣共通感染症は、野生動物が感染源となって直接又は媒介動物を通じて人に感染を起こす。
疫学概論 時系列研究 Lesson 11. 記述疫学 §B. 時系列研究 S.Harano,MD,PhD,MPH.
平成22年度    計 量 心 理 学  a.
USEDセレクトショップにおける 新規顧客獲得のための広告に関する研究
情報処理の概念 #0 概説 / 2002 (秋) 一般教育研究センター 安田豊.
2010応用行動分析(3) 対人援助の方法としての応用行動分析
Presentation transcript:

1 地域社会の共通語化に関する 多変量解析モデル 情報処理学会 第 85 回 人文科学とコンピュータ研究会( CH-85 ) 2010 年 2 月 6 日(琉球大学) 横山詔一 * ・阿部貴人 * ( * 国立国語研究所)

2 いまさら共通語化なんて,なにがオモロイの? 本研究は,山形県鶴岡市で 1950 年, 1971 年, 1991 年に国立国語研究所が実施した共通語化調 査 ( 以下,鶴岡調査 ) の新たな意義について考え る。 研究者のこれまでの関心は,おもに,地域社会 における言語生活の実態記述(記録)にあった。 約 50 年間にわたって蓄積された言語変化データ に別の角度からアプローチを試みることで,脳 科学や老年学などの分野にも寄与できるインパ クトのある知見を見いだせるかも。

3 なぁんてタテマエで,鶴岡は「酒井の殿はん」が いてはるええとこ。そこでお酒が飲めるからオモ ロイ。

4 山形県鶴岡市 江戸時代の庄内藩 藤沢周平氏の時代小説 海坂(うなさか)藩のモデル

5 縦断(実時間経年)調査と社会脳仮説のコラボ たとえば,鶴岡市で縦断的(経年的)に実施された共通 語化調査のグラフには,鶴岡市民の脳内に蓄積・記憶さ れている言語的記憶の平均像に関する経年変化が投影さ れている,と考えてみてはどうだろうか。 これは,(ある地域社会で生活する)話者集団の記憶装 置としてのレキシコンに関する仮説であるから,これか らは新たに「社会的レキシコン( social lexicon )仮説」 と呼ぶ。 レキシコンの生涯変化に関するデータは,加齢 ( aging )による認知症( dementia )や失語症 ( aphasia )の医学研究にも有用な知見を与える可能性 が期待される。

6 社会的レキシコンの生涯変化について レキシコンは言語形成期(以下,臨界期とい う場合もある)を過ぎると変化しない。 → レ キシコン固定説 レキシコンは臨界期を過ぎても,生涯を通し て変化し続ける。 → レキシコン変化説 どっちやろ?

7 横断調査:見かけ上の時間変化 グラフの縦軸は英語の動詞 sneak の過去形として sneaked ではなく snuck が 使用される率を,横軸は年 代層(世代)。 ここで「臨界期に獲得され たレキシコンは,臨界期を 過ぎると変化しない」とい う「レキシコン固定説」に 立つと, snuck の使用率が sneaked のそれを逆転した のは約 50 年前であったと推 定できる。 図 1 カナダ英語における語形交替の例 「 sneaked → snuck 」 【 Chambers ( 2006 )より】

8 グラフを見やすく拡大すると 図 1 カナダ英語における語形交替の例 「 sneaked → snuck 」 【 Chambers ( 2006 )より】

9 見かけ上の時間変化:レキシコン固定説に 立脚 その理由は次の通り。 snuck 使用率が 50 %を超え て sneaked を上回るのは 60 歳をすこし過ぎたあたり。 臨界期が 10 歳前後だとする と, 60 歳代の住民が臨界期 を迎えたのは,年齢から約 10 年をマイナスした約 50 年前。 その時期に,その地域社会 での snuck 使用率が 50 %を 超え,ちょうど臨界期を過 ごしていた住民の脳内にそ の痕跡が記憶された。 図 1 カナダ英語における語形交替の例 「 sneaked → snuck 」 【 Chambers ( 2006 )より】

10 レキシコン固定説の検証 さて,「言語習得期に獲得されたレキシコンは,言 語習得期を過ぎると変化しない」のであれば・・・ ある地域社会で生年がほぼ同じ調査対象者集団を経 年的に繰り返してランダム抽出した場合(あるいは 同一人物を追跡した場合)において, かなり長い時間が経過した後でも,同じ調査項目に 対しては,回答傾向がほぼ重なる。 つまり,変化のカーブは1本につながるはず。

11 レキシコン固定説を支持するデータ 図 2 は音韻項目 207 「ネコ: 非語頭におけるカ行有声化 の有無」の結果。 「生年」だけを説明変数と する S 字カーブが観測値と うまく一致。カーブは1本 につながる。 すなわち,同一生年の世代 の回答は変化なし。 「臨界期に獲得されたレキ シコンは,その後は変化し ない」というレキシコン固 定説が実時間調査によって 検証された典型例。 図 2 「ネコ」項目 207 の共通語化 【横山詔一・真田治子(印刷中)より】

12 定説:アクセントは音韻よりも変化し にくい これ,ホンマですか ? 鶴岡調査データはどうか?確認してみよう。 いちおう,もっともらしい多変量解析として, ロジスティック回帰分析を使ってみた。 以下の式 〔 3 〕で共通語化の S 字カーブが 1 本につな がるのか否かを統計的に検定。 log [ p / (1 - p) ] = a1× 生年+ a2× 調査年+ b 〔 3 〕

13 項目 207 「ネコ:非語頭におけるカ行有声化の有無」 Year of the birth □ 3rd 1991 △ 2nd 1971 ○ 1st 1950 ネコの音韻

14 項目 207 「ネコ:アクセント」 Year of the birth □ 3rd 1991 △ 2nd 1971 ○ 1st 1950 ネコのアクセント

15 項目 207 「ネコ:カ行有声化の有無とアクセント」 Year of the birth □ 3rd 1991 △ 2nd 1971 ○ 1st 1950 Accent Voicing 音韻とアクセント

16 「アクセントは音韻よりも変化しにくい」 というのは言語学界の定説ですが,ホンマ ですか?  同じ「ネコ」でも,音韻についての「非語頭に おけるカ行有声化の有無」は臨界期を過ぎると 変化しないのに,アクセントは生涯を通じて共 通語化が進む。  音韻の共通語化はレキシコン固定説を支持。  アクセントはレキシコン変化説を支持。  定説とは「一致しない」ようにも見える が・・・。  次に示す「旗(ハタ)」はアクセントだけでは なく音韻もレキシコン変化説を支持。

17 Year of the birth □ 3rd 1991 △ 2nd 1971 ○ 1st 1950 項目 210 「ハタ:非語頭におけるタ行有声化の有無」 旗(ハタ)の音韻

18 項目 210 「ハタ:アクセント」 Year of the birth □ 3rd 1991 △ 2nd 1971 ○ 1st 1950 旗(ハタ)のアクセント

19 項目 210 「ハタ:タ行有声化の有無とアクセント」 Year of the birth □ 3rd 1991 △ 2nd 1971 ○ 1st 1950 Accent Voicing 音韻とアクセント

20 レキシコン変化説を支持するほかのデータ そ の1 図 3 はアクセント 5 項目 「セナカ,ネコ,ハタ, カラス,ウチワ」の結果 から算出した共通語化率。 「生年」のほか「調査 年」も説明変数に加えた S 字カーブによる予測値 が1本のカーブにならな い。 つまり,「跳ね上がり現 象」が起きている。 成人期においても,同一 世代内で「共通語化」が 進行している可能性あり。 図 3 アクセントの共通語化 【横山詔一・真田治子(印刷中)より】

21 グラフを見やすく拡大すると 図 3 アクセントの共通語化 【横山詔一・真田治子(印刷中)より】

22 レキシコン変化説を支持するほかのデータ そ の2 図 4 は音韻項目 223 「エ ントツ:語頭の母音エに おける狭母音化の有無」 の共通語化率。 「生年」のほか「調査 年」も説明変数に加えた S 字カーブが 1 本のカー ブにならない。 つまり,「引き戻し現 象」が生じている。 成人後も,同一世代内で 「方言化」が進行してい る可能性。 図 4 「エントツ」の共通語化 【横山詔一・真田治子(印刷中)より】

23 グラフを見やすく拡大すると 図 4 「エントツ」の共通語化 【横山詔一・真田治子(印刷中)より】

24 まとめ:鶴岡調査の方法は横断法と縦断法の組合せ! 鶴岡調査のデザインは 第 1 次調査:住基台帳を用いてサンプルをランダム抽出 ( 577 名) 第 2 次調査:第 1 次のサンプルを追跡調査( 107 名)+新 たなサンプルをランダム抽出( 457 名) → 計 564 名の データ 第 3 次調査:第 1 次のサンプルを追跡調査( 53 名)+第 2 次のサンプルも追跡調査( 261 名)+さらに新たなサン プルをランダム抽出( 405 名) → 計 719 名のデータ 鶴岡調査のような調査手法は,生涯発達心理学や老年学に もあり,「コーホート系列法( cohort sequential method )」と呼ばれている。

25 鶴岡調査の方法は世界で最初のコーホート系列法! シアトル・プロジェクトのデザインとは  基本的に鶴岡調査や岡崎調査とまったく同じデザインの 調査が,米国のシアトル市で 1956 年から 7 年ごとに経年 的に行われている。追跡調査のほかに,毎回新たなサン プルを 500 名以上もランダム抽出。その台帳は医療保険 制度の名簿。  目的は「知能」の生涯変化を探る縦断研究。  K.W.Shaie が,この「シアトル研究」のプロジェクト・ リーダ。 コーホート系列法は時代効果,加齢効果,世代効果の 3 者 を分離可能な「もっとも効率的な調査法」として諸学界か ら高い評価を受けているが,まともな実査データは世界中 で鶴岡と岡崎の調査を除けば「シアトル研究」があるのみ 。

26 まとめ おまけ :なぜ横断研究は変化を過小評価するのか

27 調査本部となった鶴岡ホテル 第4回調査は 2011 年ごろが適切な時期 小説家 藤沢周平氏