確信度評定：方法論の吟味と社会認知研究への応用

確信度評定：方法論の吟味と社会認知研究への応用
確信度評定：方法論の吟味と社会認知研究への応用東京工業大学・日本学術振興会村山航日本心理学会第72回大会WS 「記憶のモニタリングとコントロール」

確信度評定とはハイデルベルグとボンとでどちらの人口が多いと思いますかこの単語は先ほどのリストにありましたか？
１．まずこれらの問題に２択で答えてもらう２．その上で，答えに対する自身の程度を「５０％」から「１００％」の間で答えてもらう。 ※ 言語的に，「まったく自信がない」から「非常に自信がある」という形式もある。

確信度評定の位置づけ清水先生の本では確信度評定より前の段階に焦点を当てて書いた。今回の発表では，本でも詳しく触れなかった確信度評定の方法論に焦点を当てる。

Contents 確信度評定の意義確信度評定研究が明らかにしたこと確信度評定の方法論的落とし穴と利用可能性

１．意思決定の根幹期待・価値と並んで人間の意思決定に影響を与える根源的要因
「不確実性下の意思決定」ニューロエコノミクスの隆盛で再注目確信度評定のメカニズムを知る＝人間の意思決定メカニズムを知る確信度が高くて確実な選択肢を選ぶ確信度の二面性情報を得るために確信度の低い選択肢を選ぶ

Learning rate Uncertainty bonus

２．Awareness を知る手段背景：「無意識の認知プロセス」研究の増加意識の有無を確信度評定を用いて調べる
Kolb & Braun (1995, Nature): 視覚弁別課題．ターゲットが見えるドット (unpaired dots) とターゲットが（ほぼ）みえないドット (paired dots) の２種類を比較

確信度とともに正答率も上昇確信度と正答率は無関係無意識の知覚プロセスの存在しかし，トータルのパフォーマンスは同じ
Adopted from Kolb & Braun (1995) 確信度とともに正答率も上昇確信度と正答率は無関係下の太い線は，それぞれの確信度を選択した割合のヒストグラム無意識の知覚プロセスの存在しかし，トータルのパフォーマンスは同じ

近年の方法論の進展確信度評定は意図的な歪曲に弱い
Post-decision wagering (Persaud et al., 2006, Nat. Neurosci.)

近年における方法論の進展判断に対するwagering（賭け）２値判断確信度評定は意図的な歪曲に弱い
Post-decision wagering (Persaud et al., 2006, Nat. Neurosci.) High wager あっていたら１ポンドget 違っていたら１ポンドlose 判断に対するwagering（賭け）２値判断 Low wager あっていたら50ペンスget 違っていたら50ペンスlose 意図的な歪曲を「お金への動機」で除去

結論：G. Y. はこの課題を awareness なしでこなしている
Persaud et al. (2006) の blindsight subject G. Y. に対する視覚弁別課題の結果 correct incorrect Total High wager 67 23 90 Low wager 74 36 110 141 59 200 しかし，High wager でも Low wager でも正答率に変化がない全体的な正答率は高い結論：G. Y. はこの課題を awareness なしでこなしている

まとめ確信度評定研究の意義人間の意思決定のメカニズムを考える上で不可欠人間のAwarenessを調べるのに重要なツール

一言でいうと人間の確信度評定は不正確

１．Overconfidence Phenomenon
確信度評定を一定の区間ごとに区切り，その区間ごとに実際の正答率をプロットすると，正答率よりも確信度の方が高くなる現象

Overconfidence の説明モデル
Probabilistic mental model: Gigerenzer et al. (1991, Psych. Rev.) Poisson race model: Merkle & Van Zandt (2006, Psych. Rev.) Bayesian model (Moore & Healy, 2008, Psych. Rev.) モデルは口頭説明．これらのどれが妥当かということを検討するのはもちろん大切だが，これらすべてのモデルにも共通する方法論的なアーチファクトがoverconfidence現象にはある．確信度は，記憶痕跡の強さを直接評価しているのではなく，活性化された手がかりや情報，事前の信念などといった状況証拠から，間接的に推論されたもの。

２．目撃証言と確信度評定の関係 Wells & Murray (1984) のレビュー：確信度評定と正再認のpoint-biserial correlation は平均0.07(!) 理由確信度評定はさまざまな状況要因に影響を受ける： e.g. 知覚的流暢性 (Koriat et al., 2002; Leboe & Whittlesea, 2002) 「目撃証言」につきまとう独特のプレッシャー

適応的意味は？ (e.g., Marsh, Todd, & Gigerenzer, 2004)
まとめと今後の展望人間の確信度評定は不確実確信度評定は，そのときに活性化している状況要因に影響を受けやすい確信度評定は人間の意思決定を導く重要な要因人間の確信度評定は不正確適応的意味は？ (e.g., Marsh, Todd, & Gigerenzer, 2004)

確信度評定の方法論としての難しさ確信度の「正確さ」の指標によって，得られる結果が変わってくる (e.g., Olsson, 2000)
選択をしていない選択肢には確信度評定をしていないので，データ構造が複雑。そのため，アーティファクトに気づきにくい

例１：Post-decision wagering の問題点
Persaud らが想定している optimal strategy Clifford et al. (2007, TICS) の批判 Optimal strategyは「すべてをhigh wagerにする」では？ Incorrect のとき low wager にするのは一見合理的だが，それならばもう１つの選択肢（正答）を選ぶべきである correct incorrect Total High wager 103 17 120 Low wager 19 61 80 122 78 200 実際は信号検出理論の観点からの批判もしているこの課題はawarenessの有無と，optimal strategyの気づきの有無が交絡

例２：Overconfidence現象の問題点
回帰直線？ (Erev, 1994) ＝ Overconfidence は判断時の誤差による回帰効果（artifact） Overconfidence 研究では，測定の誤差をできる限り減らす必要性先ほどのoverconfidence の直線を0-50%までに拡張した（もう１つの選択肢の50-100%の確信度を反転させた）のが新しい図。まったく同じデータでもProportion of correct の条件つき分布としてプロットすると，なんとunderconfidenceのグラフになってしまう（回帰の方向が変わってくるから）。

確信度評定の方法論としての利用可能性方法論的に扱うのが難しいが，うまく使うと方法論として非常に優れた側面
確信度評定による測定の精度の向上（張, 2007) 識別できなかったモデルの識別「識別できないモデルの識別」という意味は，とりあえず自分の研究を紹介する中で導入

Murayama (in prep)：感情誤帰属手続きへの適用
感情誤帰属手続き (affect misattribution procedure; AMP) Payne et al. (2005, JPSP) による開発潜在的な態度を測定する尺度：社会認知測度高い信頼性 (Payne et al., 2005) と予測的妥当性 (Payne et al., 2008, C&E)

基本的な手続き Judgment of the “target” Primeに対する潜在的態度 Prime Target
p (“like”| target prime) – p (“like” | no prime) Judgment of the “target” Like -> Left key Dislike -> Right key Primeに対する潜在的態度

自動的な判断過程と統制的（意図的）な修正過程を分離する必要性
問題点意図的な反応の修正が入ってしまう：「この文字は『好き』だけど，その前の写真の影響を受けているかもしれない．だから『嫌い』を選ぼう」自動的な判断過程と統制的（意図的）な修正過程を分離する必要性

研究の目的 AMPにおける自動処理・統制処理を分離するためのモデルを提案し，その妥当性を検討する

モデルの提案 “好き”“嫌い”の判断には信号検出モデルを仮定一定の確率（R）で被験者がプライムの影響に気づき反応を修正する
反応の修正量をBとする Negative prime条件をベースラインとする閾値 (c) positive prime 閾値の修正量 (B) no prime negative prime d’2 d’1 嫌い好き

モデル式プライムの影響に気づいた場合閾値の修正（向きが逆）プライムの影響に気づかない場合
ネガティブプライムへの反応をbaselineとしたときの，それぞれのd’（潜在態度） no prime 条件では意図的な修正はなし

問題点と確信度評定による解決パラメータ推定 R, B, c, d’1, d’2の 5 つ方程式（データ）は３つ解が求まらない！
ターゲット判断に確信度評定を用いる（５件法）ことで，方程式（自由度）が増え，解が求まる ※ モデルとデータから得られる予測値の二乗誤差が最小になるように準Newton法でパラメータを推定

確信度評定による自由度の増大 “1” “2” “3” C1 C2 Target Distractor 嫌い好き増加するパラメータ：c2
３件法の場合 “1” “2” “3” C1 C2 Target Distractor 嫌い好き増加するパラメータ：c2 自由度増大！増えた方程式：p (<c2|target), p (<c2|distractor)

先行研究確信度評定によってモデルの自由度を増大させるアイディア自体は他の研究にも内在社会認知研究では応用がない → 本研究
信号検出モデル（自由度０）における正規性の前提の検証 (Green & Swets, 1966) Andrew Yonelinas による二重過程信号検出モデル (for a review, Yonelinas & Parks, 2007, PB) 社会認知研究では応用がない → 本研究他のモデル・論争にも適用可能？回想-熟知性の独立性に関する論争 (e.g., Joordens & Merikle, 1993)

実験１目的：提案した手続きを適用し，意味のある解が得られるかを検討する被験者：北米の大学生26名
プライム刺激：ポジティブ写真，ネガティブ写真３２枚ずつ (IAPSより, 覚醒を統制）ターゲット刺激：中国語刺激

Like-dislike judgment

Confidence judgment

1000ms

Like-dislike judgment

Confidence judgment

実験１：結果ターゲットのポジティブ度判断の平均値プライムの主効果が有意（先行研究の再現）

No prime/negative prime
ROC曲線と推定値 Positive prime/negative prime No prime/negative prime R = 0.10 B = 1.51 d’1= 0.84 d’2= 0.37

実験２目的：AMPを２回繰り返すことで，プライムへの気づきが増大するかを検討する被験者：北米の大学生54名
ターゲット呈示後，すぐにポジティブ度判断（６件法）１週間後に２回目のAMP実験をする

実験２：結果２回目のポジティブ度判断ターゲットのポジティブ度判断の平均値実験１の結果を再現

ROC曲線と推定値 Positive prime/negative prime (Time 2) No prime/negative prime (Time 2) R = 0.08 B = 1.57 d’1= 0.77 d’2= 0.35 R = 0.20 B = 1.51 d’1= 1.11 d’2= 0.52 Time 1 Time 2

実験３目的：明示的に統制処理を高める教示を行うことで，Rの推定値が上昇するかを検討する被験者：北米の大学生14名
試行開始前に「ポジティブ度判断が写真によって影響を受けないように」と強く教示 Please try your absolute best not to let the real-life images bias your judgment of the drawings!

実験３：結果ターゲットのポジティブ度判断の平均値教示の効果が見られた ⇒ 潜在的態度の変容？

ROC曲線と推定値 Positive prime/negative prime No prime/negative prime R = 0.66 B = 0.74 d’1= 0.90 d’2= 0.44 ポジティブ度評定に群間差がないのは，潜在的態度 (d’) が変化したのではなく，Rの上昇によるもの

まとめ確信度評定は，方法論上のさまざまな落とし穴がある。しかし，うまく使えば，通常の方法論では解決できない問題を解決する鍵になる．

ご静聴ありがとうございました資料請求・質問などは以下へ村山航

他モデルとの比較他モデルとの比較 Payne et al. (personal communication)：AMPに過程分離手続きを適用するモデルを開発中情報をフルに使っていない（no prime条件の結果を使わず） R の過程が生じたときに被験者が何をしているかがわかりにくい条件数が増える（inclusion, exclusion, and baseline conditions)

今後の展望動物における確信度測定方法の整備確信度のモデル化の方法
確信度という概念の系統発生的な起源脳における認知プロセスの解明に寄与確信度のモデル化の方法これまでは基本的にパラメータそのものベイズモデルのパラメータ分散という視点 (Daw et al., 2006, Nature) １．確信度そのものをエンコードする部位の発見 (e.g., Kepecs et al., in press, Nature)

確信度と２値反応（正誤）の関係指標 Point-biserial correlationの問題：実際の正誤をそのまま０-１の値として扱ってしまう γ係数は他のメタ記憶研究であるFOK研究ではよく見るが，なぜか目撃証言研究ではそれほどみない．

Point-biserial correlation could be as small as 0.30 (!)
完璧に予測できているように見えても… ここが誤差にこの図は，一見すると完璧に見えるが，point-biserial correlationだと0.30（もしくはそれ以下）になることもありえる．被験者が「３割正答する」といって本当に３割正答したとしても，実際は「１」と「０」からデータは成立しているので，個々の観測値と「３割」の点にはズレが生じてしまい，相関を下げてしまうから． Point-biserial correlation could be as small as 0.30 (!)

確信度と２値反応（正誤）の関係指標 Point-biserial correlationの問題：実際の正誤をそのまま０-１の値として扱ってしまうこうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均． Calibration は，相関係数のように相対的な共変動ではなく，値の絶対的なズレで定義されている点が，相関指標と大きく違うと一般的にはよく言われている．しかし，今回の文脈ではそれは重要ではない．Calibrationは，確信度と個々の観測変数とのズレではなく，それぞれの区間ごとの正答「率」と確信度とのズレを調べているため，誤差が蓄積しない．先ほどの例では，perfect calibrationになる．

Calibration could involve less errors
完全に予測できた場合の直線（仮想）ここだけが誤差に実際の正答「率」 Calibration could involve less errors

確信度と２値反応（正誤）の関係指標 Point-biserial correlationの問題：実際の正誤をそのまま０-１の値として扱ってしまうこうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均． biserial-correlation: ２値反応の背後に正規分布を仮定．

Biserial correlation has less errors
閾値 Biserial correlation has less errors

確信度と２値反応（正誤）の関係指標 Point-biserial correlationの問題：実際の正誤をそのまま０-１の値として扱ってしまうこうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均． biserial-correlation: ２値反応の背後に正規分布を仮定． γ係数 (Kruskal, 1958)：順位をもとにした相関 (Nelson, 1984)． γ係数は他のメタ記憶研究であるFOK研究では (Nelsonが薦めているだけあって）よく見るが，なぜか目撃証言研究ではそれほどみない． Olsson (2000) のメタ分析： Calibration 指標を使うと，確信度を使うことで目撃証言の精度は上がっている精度をあげたいならそれに見合った指標を使う必要性

確信度評定：方法論の吟味と社会認知研究への応用

Similar presentations

Presentation on theme: "確信度評定：方法論の吟味と社会認知研究への応用"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

確信度評定：方法論の吟味と 社会認知研究への応用

Similar presentations

Presentation on theme: "確信度評定：方法論の吟味と 社会認知研究への応用"— Presentation transcript:

Similar presentations

About project

フィードバック

確信度評定：方法論の吟味と社会認知研究への応用

Presentation on theme: "確信度評定：方法論の吟味と社会認知研究への応用"— Presentation transcript: