確信度評定:方法論の吟味と 社会認知研究への応用

Slides:



Advertisements
Similar presentations
Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
CMU2005 海外エンジニアリングワークショップ参加報告書 1 「真の要求を見極めろ!」: teamB 要求定義をどう捉えるか ● 要求定義とは何か? 製品には、顧客の望むことを正しく反映させる必要がある。 そのために必要なものが要求仕様である。 すなわち、要求仕様とは、顧客と製品を結ぶものであり、これを作ることが要求定義である。
認知心理学の知見のさわり 知覚、記憶、学習、思考などを研究対象とする心理学の一 分野。 [せまい意味] 認知の領域をあつかう心理学(人間の認知の働き)を 研究対象としてとりあげ、 コンピューター科学をはじめとする認知科学の枠組みの もとで 解明していこうという心理学の一領域をさす。 認知科学 心理学、コンピューター科学、脳神経科学、言語学、哲.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
配偶者選択による グッピー (Poecilia reticulata) の カラーパターンの進化 :野外集団を用いた研究 生物多様性進化分野 A1BM3035 吉田 卓司.
心理測定論 信号検出理論.
「ストレスに起因する成長」に関する文献的検討
データ分析入門(12) 第12章 単回帰分析 廣野元久.
心理的ストレスに対する心臓血管反応 ー認知的評価の導入ー 社会精神生理学への招待 日本大学大学院理工学研究科 山田クリス孝介
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
心理学基礎論 4月14日 感覚・知覚① 感覚の測定.
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
心理的報酬と課題の難易度が 課題に対する評価に及ぼす影響 社会工学における戦略的思考 動機付け班 池田 遼太 岩渕 佑一朗 清宮 晨博
心理測定法 4月14日~21日 感覚の測定.
コメント 狩野 裕 大阪大学人間科学部 日本心理学会ワークショップ 「探索的因子分析における変数の選択(3)」
執筆者:市川伸一 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
分布の非正規性を利用した行動遺伝モデル開発
音楽による影響と 事象関連電位との関連 大正大学 人間学部人間科学科3年  宮内 悠.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Bassモデルにおける 最尤法を用いたパラメータ推定
情報は人の行為に どのような影響を与えるか
ソシオン理論における 三者関係のシミュレーション
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
回帰分析.
心理測定法 4月14日~21日 感覚の測定.
因果関係3原則 2009年月曜日・3時限 社会理論と調査法.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
ワークショップ ユーザーとメーカーの公開相談会
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
心理学 武庫川女子大学文学部教育学科 北口勝也 http: //www. mukogawa-u.ac.jp/~kitaguti.
脳活動に関するデータ データの種類 データの特徴 脳波・脳磁図・fMRI画像 脳活動とパフォーマンスの関係はきわめて冗長。
小標本検査データを元にした 疲労破損率のベイズ推定
相関分析.
第6章 連立方程式モデル ー 計量経済学 ー.
井澤修平 早稲田大学大学院人間科学研究科 日本学術振興会特別研究員
4章までのまとめ ー 計量経済学 ー.
執筆者:伊東 昌子 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
二重課題による ワーキングメモリの増減  情報システム工学科3年 038 田中 祐史.
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
学びを促進する“インフォームドアセスメント” -学力評価の方向づけ機能に着目して-
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
フレアの非熱的成分とサイズ依存性    D1 政田洋平      速報@太陽雑誌会(10/24).
再討論 狩野裕 (大阪大学人間科学部).
大学生における援助要請行動の 調査研究.
心理科学・保健医療行動科学の視点に基づく
部分的最小二乗回帰 Partial Least Squares Regression PLS
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
感情の持続に及ぼす認知的評価の影響 同志社大学文学研究科 手塚 洋介 【日本心理学会第68回大会ワークショップ】 社会精神生理学への招待
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
ベイズ最適化 Bayesian Optimization BO
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
通訳研究分野の概観図 General Map of Interpreting Studies
回帰分析(Regression Analysis)
設計情報の再利用を目的とした UML図の自動推薦ツール
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
MOIRCSサイエンスゼミ 銀河団銀河のMorphology-Density Relation
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
イメージや意識通りの動きの習得 ~野球の打撃において~
自然言語処理2008 平成20年12月22日.
北大MMCセミナー 第82回 附属社会創造数学センター主催 Date: 2018年4月26日(木) 16:30~18:00
SDQ-S利用上の問題点と精度の高い方向感覚測定法の確立に向けて
Presentation transcript:

確信度評定:方法論の吟味と 社会認知研究への応用 確信度評定:方法論の吟味と 社会認知研究への応用 東京工業大学・日本学術振興会 村山 航 日本心理学会第72回大会WS 「記憶のモニタリングとコントロール」

確信度評定とは ハイデルベルグとボンとでどちらの人口が多いと思いますか この単語は先ほどのリストにありましたか? 1.まずこれらの問題に2択で答えてもらう 2.その上で,答えに対する自身の程度を「50%」から「100%」の間で答えてもらう。 ※ 言語的に,「まったく自信がない」から「非常に自信がある」という形式もある。

確信度評定の位置づけ 清水先生の本では確信度評定より前の段階に焦点を当てて書いた。今回の発表では,本でも詳しく触れなかった確信度評定の方法論に焦点を当てる。

Contents 確信度評定の意義 確信度評定研究が明らかにしたこと 確信度評定の方法論的落とし穴と利用可能性

Contents 確信度評定の意義 確信度評定研究が明らかにしたこと 確信度評定の方法論的落とし穴と利用可能性

1.意思決定の根幹 期待・価値と並んで人間の意思決定に影響を与える根源的要因 「不確実性下の意思決定」 ニューロエコノミクスの隆盛で再注目 確信度評定のメカニズムを知る = 人間の意思決定メカニズムを知る 確信度が高くて確実な選択肢を選ぶ 確信度の二面性 情報を得るために確信度の低い選択肢を選ぶ

Learning rate Uncertainty bonus

2.Awareness を知る手段 背景:「無意識の認知プロセス」研究の増加 意識の有無を確信度評定を用いて調べる Kolb & Braun (1995, Nature): 視覚弁別課題.ターゲットが見えるドット (unpaired dots) とターゲットが(ほぼ)みえないドット (paired dots) の2種類を比較

確信度とともに正答率も上昇 確信度と正答率は無関係 無意識の知覚 プロセスの存在 しかし,トータルのパフォーマンスは同じ Adopted from Kolb & Braun (1995) 確信度とともに正答率も上昇 確信度と正答率は無関係 下の太い線は,それぞれの確信度を選択した割合のヒストグラム 無意識の知覚 プロセスの存在 しかし,トータルのパフォーマンスは同じ

近年の方法論の進展 確信度評定は意図的な歪曲に弱い Post-decision wagering (Persaud et al., 2006, Nat. Neurosci.)

近年における方法論の進展 判断に対するwagering(賭け) 2値判断 確信度評定は意図的な歪曲に弱い Post-decision wagering (Persaud et al., 2006, Nat. Neurosci.) High wager あっていたら1ポンドget 違っていたら1ポンドlose 判断に対するwagering(賭け) 2値判断 Low wager あっていたら50ペンスget 違っていたら50ペンスlose 意図的な歪曲を「お金への動機」で除去

結論:G. Y. はこの課題を awareness なしでこなしている Persaud et al. (2006) の blindsight subject G. Y. に対する視覚弁別課題の結果 correct incorrect Total High wager 67 23 90 Low wager 74 36 110 141 59 200 しかし,High wager でも Low wager でも正答率に変化がない 全体的な正答率は高い 結論:G. Y. はこの課題を awareness なしでこなしている

まとめ 確信度評定研究の意義 人間の意思決定のメカニズムを考える上で不可欠 人間のAwarenessを調べるのに重要なツール

Contents 確信度評定の意義 確信度評定研究が明らかにしたこと 確信度評定の方法論的落とし穴と利用可能性

一言でいうと 人間の確信度評定は不正確

1.Overconfidence Phenomenon 確信度評定を一定の区間ごとに区切り,その区間ごとに実際の正答率をプロットすると,正答率よりも確信度の方が高くなる現象

Overconfidence の説明モデル Probabilistic mental model: Gigerenzer et al. (1991, Psych. Rev.) Poisson race model: Merkle & Van Zandt (2006, Psych. Rev.) Bayesian model (Moore & Healy, 2008, Psych. Rev.) モデルは口頭説明.これらのどれが妥当かということを検討するのはもちろん大切だが,これらすべてのモデルにも共通する方法論的なアーチファクトがoverconfidence現象にはある. 確信度は,記憶痕跡の強さを直接評価しているのではなく,活性化された手がかりや情報,事前の信念などといった状況証拠から,間接的に推論されたもの。

2.目撃証言と確信度評定の関係 Wells & Murray (1984) のレビュー:確信度評定と正再認のpoint-biserial correlation は平均0.07(!) 理由 確信度評定はさまざまな状況要因に影響を受ける: e.g. 知覚的流暢性 (Koriat et al., 2002; Leboe & Whittlesea, 2002) 「目撃証言」につきまとう独特のプレッシャー

適応的意味は? (e.g., Marsh, Todd, & Gigerenzer, 2004) まとめと今後の展望 人間の確信度評定は不確実 確信度評定は,そのときに活性化している状況要因に影響を受けやすい 確信度評定は人間の意思決定を導く重要な要因 人間の確信度評定は不正確 適応的意味は? (e.g., Marsh, Todd, & Gigerenzer, 2004)

Contents 確信度評定の意義 確信度評定研究が明らかにしたこと 確信度評定の方法論的落とし穴と利用可能性

確信度評定の方法論としての難しさ 確信度の「正確さ」の指標によって,得られる結果が変わってくる (e.g., Olsson, 2000) 選択をしていない選択肢には確信度評定をしていないので,データ構造が複雑。そのため,アーティファクトに気づきにくい

例1:Post-decision wagering の問題点 Persaud らが想定している optimal strategy Clifford et al. (2007, TICS) の批判 Optimal strategyは「すべてをhigh wagerにする」では? Incorrect のとき low wager にするのは一見合理的だが,それならばもう1つの選択肢(正答)を選ぶべきである correct incorrect Total High wager 103 17 120 Low wager 19 61 80 122 78 200 実際は信号検出理論の観点からの批判もしている この課題はawarenessの有無と,optimal strategyの気づきの有無が交絡

例2:Overconfidence現象の問題点 回帰直線? (Erev, 1994) = Overconfidence は判断時の誤差による回帰効果(artifact) Overconfidence 研究では,測定の誤差をできる限り減らす必要性 先ほどのoverconfidence の直線を0-50%までに拡張した(もう1つの選択肢の50-100%の確信度を反転させた)のが新しい図。 まったく同じデータでもProportion of correct の条件つき分布としてプロットすると,なんとunderconfidenceのグラフになってしまう(回帰の方向が変わってくるから)。

確信度評定の方法論としての利用可能性 方法論的に扱うのが難しいが,うまく使うと方法論として非常に優れた側面 確信度評定による測定の精度の向上(張, 2007) 識別できなかったモデルの識別 「識別できないモデルの識別」という意味は,とりあえず自分の研究を紹介する中で導入

Murayama (in prep):感情誤帰属手続きへの適用 感情誤帰属手続き (affect misattribution procedure; AMP) Payne et al. (2005, JPSP) による開発 潜在的な態度を測定する尺度:社会認知測度 高い信頼性 (Payne et al., 2005) と予測的妥当性 (Payne et al., 2008, C&E)

基本的な手続き Judgment of the “target” Primeに対する潜在的態度 Prime Target p (“like”| target prime) – p (“like” | no prime) Judgment of the “target” Like -> Left key Dislike -> Right key Primeに対する潜在的態度

自動的な判断過程と 統制的(意図的)な修正 過程を分離する必要性 問題点 意図的な反応の修正が入ってしまう:「この文字は『好き』だけど,その前の写真の影響を受けているかもしれない.だから『嫌い』を選ぼう」 自動的な判断過程と 統制的(意図的)な修正 過程を分離する必要性

研究の目的 AMPにおける自動処理・統制処理を分離するためのモデルを提案し,その妥当性を検討する

モデルの提案 “好き”“嫌い”の判断には信号検出モデルを仮定 一定の確率(R)で被験者がプライムの影響に気づき反応を修正する 反応の修正量をBとする Negative prime条件をベースラインとする 閾値 (c) positive prime 閾値の修正量 (B) no prime negative prime d’2 d’1 嫌い 好き

モデル式 プライムの影響に気づいた場合 閾値の修正 (向きが逆) プライムの影響に気づかない場合 ネガティブプライムへの反応をbaselineとしたときの,それぞれのd’(潜在態度) no prime 条件では意図的な修正はなし

問題点と確信度評定による解決 パラメータ推定 R, B, c, d’1, d’2の 5 つ 方程式(データ)は3つ 解が求まらない! ターゲット判断に確信度評定を用いる (5件法)ことで,方程式(自由度)が増え,解が求まる ※ モデルとデータから得られる予測値の二乗誤差が最小になるように準Newton法でパラメータを推定

確信度評定による自由度の増大 “1” “2” “3” C1 C2 Target Distractor 嫌い 好き 増加するパラメータ:c2 3件法の場合 “1” “2” “3” C1 C2 Target Distractor 嫌い 好き 増加するパラメータ:c2 自由度増大! 増えた方程式:p (<c2|target), p (<c2|distractor)

先行研究 確信度評定によってモデルの自由度を増大させるアイディア自体は他の研究にも内在 社会認知研究では応用がない → 本研究 信号検出モデル(自由度0)における正規性の前提の検証 (Green & Swets, 1966) Andrew Yonelinas による二重過程信号検出モデル (for a review, Yonelinas & Parks, 2007, PB) 社会認知研究では応用がない → 本研究 他のモデル・論争にも適用可能? 回想-熟知性の独立性に関する論争 (e.g., Joordens & Merikle, 1993)

実験1 目的:提案した手続きを適用し,意味のある解が得られるかを検討する 被験者:北米の大学生26名 プライム刺激:ポジティブ写真,ネガティブ写真32枚ずつ (IAPSより, 覚醒を統制) ターゲット刺激:中国語刺激

75ms

125ms

100ms

Like-dislike judgment

Confidence judgment

1000ms

75ms

125ms

100ms

Like-dislike judgment

Confidence judgment

実験1:結果 ターゲットの ポジティブ度 判断の平均値 プライムの主効果が有意(先行研究の再現)

No prime/negative prime ROC曲線と推定値 Positive prime/negative prime No prime/negative prime R = 0.10 B = 1.51 d’1= 0.84 d’2= 0.37

実験2 目的:AMPを2回繰り返すことで,プライムへの気づきが増大するかを検討する 被験者:北米の大学生54名 ターゲット呈示後,すぐにポジティブ度判断(6件法) 1週間後に2回目のAMP実験をする

実験2:結果 2回目のポジティブ度判断 ターゲットの ポジティブ度 判断の平均値 実験1の結果を再現

ROC曲線と推定値 Positive prime/negative prime (Time 2) No prime/negative prime (Time 2) R = 0.08 B = 1.57 d’1= 0.77 d’2= 0.35 R = 0.20 B = 1.51 d’1= 1.11 d’2= 0.52 Time 1 Time 2

実験3 目的:明示的に統制処理を高める教示を行うことで,Rの推定値が上昇するかを検討する 被験者:北米の大学生14名 試行開始前に「ポジティブ度判断が写真によって影響を受けないように」と強く教示 Please try your absolute best not to let the real-life images bias your judgment of the drawings!

実験3:結果 ターゲットの ポジティブ度 判断の平均値 教示の効果が見られた ⇒ 潜在的態度の変容?

ROC曲線と推定値 Positive prime/negative prime No prime/negative prime R = 0.66 B = 0.74 d’1= 0.90 d’2= 0.44 ポジティブ度評定に群間差がないのは,潜在的態度 (d’) が変化したのではなく,Rの上昇によるもの

まとめ 確信度評定は,方法論上のさまざまな落とし穴がある。 しかし,うまく使えば,通常の方法論では解決できない問題を解決する鍵になる.

ご静聴ありがとうございました 資料請求・質問などは以下へ 村山 航 murakou@orion.ocn.ne.jp

他モデルとの比較 他モデルとの比較 Payne et al. (personal communication):AMPに過程分離手続きを適用するモデルを開発中 情報をフルに使っていない(no prime条件の結果を使わず) R の過程が生じたときに被験者が何をしているかがわかりにくい 条件数が増える(inclusion, exclusion, and baseline conditions)

今後の展望 動物における確信度測定方法の整備 確信度のモデル化の方法 確信度という概念の系統発生的な起源 脳における認知プロセスの解明に寄与 確信度のモデル化の方法 これまでは基本的にパラメータそのもの ベイズモデルのパラメータ分散という視点 (Daw et al., 2006, Nature) 1.確信度そのものをエンコードする部位の発見 (e.g., Kepecs et al., in press, Nature)

確信度と2値反応(正誤)の関係指標 Point-biserial correlationの問題:実際の正誤をそのまま0-1の値として扱ってしまう γ係数は他のメタ記憶研究であるFOK研究ではよく見るが,なぜか目撃証言研究ではそれほどみない.

Point-biserial correlation could be as small as 0.30 (!) 完璧に予測できているように見えても… ここが誤差に この図は,一見すると完璧に見えるが,point-biserial correlationだと0.30(もしくはそれ以下)になることもありえる.被験者が「3割正答する」といって本当に3割正答したとしても,実際は「1」と「0」からデータは成立しているので,個々の観測値と「3割」の点にはズレが生じてしまい,相関を下げてしまうから. Point-biserial correlation could be as small as 0.30 (!)

確信度と2値反応(正誤)の関係指標 Point-biserial correlationの問題:実際の正誤をそのまま0-1の値として扱ってしまう こうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均. Calibration は,相関係数のように相対的な共変動ではなく,値の絶対的なズレで定義されている点が,相関指標と大きく違うと一般的にはよく言われている.しかし,今回の文脈ではそれは重要ではない.Calibrationは,確信度と個々の観測変数とのズレではなく,それぞれの区間ごとの正答「率」と確信度とのズレを調べているため,誤差が蓄積しない.先ほどの例では,perfect calibrationになる.

Calibration could involve less errors 完全に予測できた場合の直線(仮想) ここだけが誤差に 実際の正答「率」 Calibration could involve less errors

確信度と2値反応(正誤)の関係指標 Point-biserial correlationの問題:実際の正誤をそのまま0-1の値として扱ってしまう こうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均. biserial-correlation: 2値反応の背後に正規分布を仮定.

Biserial correlation has less errors 閾値 Biserial correlation has less errors

確信度と2値反応(正誤)の関係指標 Point-biserial correlationの問題:実際の正誤をそのまま0-1の値として扱ってしまう こうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均. biserial-correlation: 2値反応の背後に正規分布を仮定. γ係数 (Kruskal, 1958):順位をもとにした相関 (Nelson, 1984). γ係数は他のメタ記憶研究であるFOK研究では (Nelsonが薦めているだけあって)よく見るが,なぜか目撃証言研究ではそれほどみない. Olsson (2000) のメタ分析: Calibration 指標を使うと,確信度を使うことで目撃証言の精度は上がっている 精度をあげたいならそれに見合った指標を使う必要性