確信度評定：方法論の吟味と社会認知研究への応用

Slides:

Advertisements

Similar presentations

Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:

Advertisements

『わかりやすいパターン認識』第 5 章特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則発表日： 5 月 23 日（金）発表者：時田陽一.

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

CMU2005 海外エンジニアリングワークショップ参加報告書 1 「真の要求を見極めろ！」： teamB 要求定義をどう捉えるか ● 要求定義とは何か？製品には、顧客の望むことを正しく反映させる必要がある。そのために必要なものが要求仕様である。すなわち、要求仕様とは、顧客と製品を結ぶものであり、これを作ることが要求定義である。

認知心理学の知見のさわり知覚、記憶、学習、思考などを研究対象とする心理学の一分野。［せまい意味］認知の領域をあつかう心理学（人間の認知の働き）を研究対象としてとりあげ、コンピューター科学をはじめとする認知科学の枠組みのもとで解明していこうという心理学の一領域をさす。認知科学心理学、コンピューター科学、脳神経科学、言語学、哲.

統計学入門２関係を探る方法講義のまとめ. 今日の話変数間の関係を探るクロス集計表の検定：独立性の検定散布図、相関係数講義のまとめとキーワード「統計学入門」後の関連講義・実習社会調査士.

配偶者選択によるグッピー (Poecilia reticulata) のカラーパターンの進化：野外集団を用いた研究生物多様性進化分野 A1BM3035 吉田卓司.

心理測定論信号検出理論.

「ストレスに起因する成長」に関する文献的検討

データ分析入門（12）第12章　単回帰分析廣野元久.

心理的ストレスに対する心臓血管反応ー認知的評価の導入ー社会精神生理学への招待日本大学大学院理工学研究科山田クリス孝介

点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上

心理学基礎論 4月14日感覚・知覚① 感覚の測定.

　　個人投資家向け株式分析　　と予測システム A１グループ　　劉　チュン.

多変量解析　－重回帰分析－発表者：時田　陽一発表日：11月20日.

配偶者選択によるグッピー(Poecilia reticulata)のカラーパターンの進化：野外集団を用いた研究

心理的報酬と課題の難易度が課題に対する評価に及ぼす影響社会工学における戦略的思考動機付け班池田遼太岩渕佑一朗清宮晨博

心理測定法 4月14日～21日感覚の測定.

コメント狩野裕大阪大学人間科学部日本心理学会ワークショップ「探索的因子分析における変数の選択（3）」

執筆者：市川伸一授業者：寺尾敦 atsushi [at] si.aoyama.ac.jp

第37回日本看護研究学会学術集会シンポジウムII 20011/8/8(月)（デブの日）14：40～16:40 中山和弘（聖路加看護大学）

分布の非正規性を利用した行動遺伝モデル開発

音楽による影響と事象関連電位との関連大正大学　人間学部人間科学科３年　宮内　悠.

土木計画学第５回（１１月２日）調査データの統計処理と分析３担当：榊原　弘之.

Bassモデルにおける最尤法を用いたパラメータ推定

情報は人の行為にどのような影響を与えるか

ソシオン理論における三者関係のシミュレーション

第6章２つの平均値を比較する２つの平均値を比較する方法の説明　　　独立な2群の平均値差の検定　　対応のある2群の平均値差の検定.

心理測定法 4月14日～21日感覚の測定.

因果関係3原則 2009年月曜日・3時限社会理論と調査法.

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

ワークショップユーザーとメーカーの公開相談会

回帰モデル・クラス分類モデルを評価・比較するためのモデルの検証 Model validation

心理学武庫川女子大学文学部教育学科北口勝也 http: //www. mukogawa-u.ac.jp/~kitaguti.

脳活動に関するデータデータの種類データの特徴脳波・脳磁図・fMRI画像脳活動とパフォーマンスの関係はきわめて冗長。

小標本検査データを元にした疲労破損率のベイズ推定

第６章連立方程式モデルｰ計量経済学ｰ.

井澤修平早稲田大学大学院人間科学研究科日本学術振興会特別研究員

4章までのまとめｰ計量経済学ｰ.

執筆者：伊東昌子授業者：寺尾敦 atsushi [at] si.aoyama.ac.jp

二重課題によるワーキングメモリの増減　情報システム工学科3年　038　田中祐史.

卒論の書き方：参考文献について 2017年9月27日小尻智子.

学びを促進する“インフォームドアセスメント” －学力評価の方向づけ機能に着目して－

指標の数と信頼性・内容的妥当性指標の数は多いほうがよい.

配偶者選択によるグッピー(Poecilia reticulata)のカラーパターンの進化：野外集団を用いた研究

フレアの非熱的成分とサイズ依存性　　　D1　政田洋平　　　　　　速報＠太陽雑誌会（10/24）.

再討論狩野裕（大阪大学人間科学部）.

大学生における援助要請行動の調査研究.

心理科学・保健医療行動科学の視点に基づく

部分的最小二乗回帰 Partial Least Squares Regression PLS

対応のある共分散分散行列の同時分析ーー震災ストレスデータの同時分析ーー

確率と統計2009 第12日目(A).

データの型量的データ質的データ数字で表現されるデータ身長、年収、得点カテゴリで表現されるデータ性別、職種、学歴

１．因子分析とは２．因子分析を行う前に確認すべきこと３．因子分析の手順４．因子分析後の分析５．参考文献６．課題11

感情の持続に及ぼす認知的評価の影響同志社大学文学研究科手塚洋介【日本心理学会第68回大会ワークショップ】社会精神生理学への招待

「アルゴリズムとプログラム」結果を統計的に正しく判断三学期第7回袖高の生徒ってどうよ調査(3)

ベイズ最適化 Bayesian Optimization BO

情報経済システム論：第13回担当教員　黒田敏史 2019/5/7 情報経済システム論.

通訳研究分野の概観図 General Map of Interpreting Studies

回帰分析（Regression Analysis)

設計情報の再利用を目的とした UML図の自動推薦ツール

配偶者選択によるグッピー(Poecilia reticulata)のカラーパターンの進化：野外集団を用いた研究

MOIRCSサイエンスゼミ銀河団銀河のMorphology-Density Relation

小標本に関する平均の推定と検定標本が小さい場合，標本分散から母分散を推定するときの不確実さを加味したｔ分布を用いて，推定や検定を行う

イメージや意識通りの動きの習得～野球の打撃において～

自然言語処理2008 平成20年12月22日.

北大ＭＭＣセミナー第82回附属社会創造数学センター主催 Date：２０１８年４月２６日（木）１６：３０～１８：００

SDQ-S利用上の問題点と精度の高い方向感覚測定法の確立に向けて

Presentation transcript:

確信度評定：方法論の吟味と社会認知研究への応用確信度評定：方法論の吟味と社会認知研究への応用東京工業大学・日本学術振興会村山航日本心理学会第72回大会WS 「記憶のモニタリングとコントロール」

確信度評定とはハイデルベルグとボンとでどちらの人口が多いと思いますかこの単語は先ほどのリストにありましたか？１．まずこれらの問題に２択で答えてもらう２．その上で，答えに対する自身の程度を「５０％」から「１００％」の間で答えてもらう。 ※ 言語的に，「まったく自信がない」から「非常に自信がある」という形式もある。

確信度評定の位置づけ清水先生の本では確信度評定より前の段階に焦点を当てて書いた。今回の発表では，本でも詳しく触れなかった確信度評定の方法論に焦点を当てる。

Contents 確信度評定の意義確信度評定研究が明らかにしたこと確信度評定の方法論的落とし穴と利用可能性

Contents 確信度評定の意義確信度評定研究が明らかにしたこと確信度評定の方法論的落とし穴と利用可能性

１．意思決定の根幹期待・価値と並んで人間の意思決定に影響を与える根源的要因「不確実性下の意思決定」ニューロエコノミクスの隆盛で再注目確信度評定のメカニズムを知る＝人間の意思決定メカニズムを知る確信度が高くて確実な選択肢を選ぶ確信度の二面性情報を得るために確信度の低い選択肢を選ぶ

Learning rate Uncertainty bonus

２．Awareness を知る手段背景：「無意識の認知プロセス」研究の増加意識の有無を確信度評定を用いて調べる Kolb & Braun (1995, Nature): 視覚弁別課題．ターゲットが見えるドット (unpaired dots) とターゲットが（ほぼ）みえないドット (paired dots) の２種類を比較

確信度とともに正答率も上昇確信度と正答率は無関係無意識の知覚プロセスの存在しかし，トータルのパフォーマンスは同じ Adopted from Kolb & Braun (1995) 確信度とともに正答率も上昇確信度と正答率は無関係下の太い線は，それぞれの確信度を選択した割合のヒストグラム無意識の知覚プロセスの存在しかし，トータルのパフォーマンスは同じ

近年の方法論の進展確信度評定は意図的な歪曲に弱い Post-decision wagering (Persaud et al., 2006, Nat. Neurosci.)

近年における方法論の進展判断に対するwagering（賭け）２値判断確信度評定は意図的な歪曲に弱い Post-decision wagering (Persaud et al., 2006, Nat. Neurosci.) High wager あっていたら１ポンドget 違っていたら１ポンドlose 判断に対するwagering（賭け）２値判断 Low wager あっていたら50ペンスget 違っていたら50ペンスlose 意図的な歪曲を「お金への動機」で除去

結論：G. Y. はこの課題を awareness なしでこなしている Persaud et al. (2006) の blindsight subject G. Y. に対する視覚弁別課題の結果 correct incorrect Total High wager 67 23 90 Low wager 74 36 110 141 59 200 しかし，High wager でも Low wager でも正答率に変化がない全体的な正答率は高い結論：G. Y. はこの課題を awareness なしでこなしている

まとめ確信度評定研究の意義人間の意思決定のメカニズムを考える上で不可欠人間のAwarenessを調べるのに重要なツール

Contents 確信度評定の意義確信度評定研究が明らかにしたこと確信度評定の方法論的落とし穴と利用可能性

一言でいうと人間の確信度評定は不正確

１．Overconfidence Phenomenon 確信度評定を一定の区間ごとに区切り，その区間ごとに実際の正答率をプロットすると，正答率よりも確信度の方が高くなる現象

Overconfidence の説明モデル Probabilistic mental model: Gigerenzer et al. (1991, Psych. Rev.) Poisson race model: Merkle & Van Zandt (2006, Psych. Rev.) Bayesian model (Moore & Healy, 2008, Psych. Rev.) モデルは口頭説明．これらのどれが妥当かということを検討するのはもちろん大切だが，これらすべてのモデルにも共通する方法論的なアーチファクトがoverconfidence現象にはある．確信度は，記憶痕跡の強さを直接評価しているのではなく，活性化された手がかりや情報，事前の信念などといった状況証拠から，間接的に推論されたもの。

２．目撃証言と確信度評定の関係 Wells & Murray (1984) のレビュー：確信度評定と正再認のpoint-biserial correlation は平均0.07(!) 理由確信度評定はさまざまな状況要因に影響を受ける： e.g. 知覚的流暢性 (Koriat et al., 2002; Leboe & Whittlesea, 2002) 「目撃証言」につきまとう独特のプレッシャー

適応的意味は？ (e.g., Marsh, Todd, & Gigerenzer, 2004) まとめと今後の展望人間の確信度評定は不確実確信度評定は，そのときに活性化している状況要因に影響を受けやすい確信度評定は人間の意思決定を導く重要な要因人間の確信度評定は不正確適応的意味は？ (e.g., Marsh, Todd, & Gigerenzer, 2004)

Contents 確信度評定の意義確信度評定研究が明らかにしたこと確信度評定の方法論的落とし穴と利用可能性

確信度評定の方法論としての難しさ確信度の「正確さ」の指標によって，得られる結果が変わってくる (e.g., Olsson, 2000) 選択をしていない選択肢には確信度評定をしていないので，データ構造が複雑。そのため，アーティファクトに気づきにくい

例１：Post-decision wagering の問題点 Persaud らが想定している optimal strategy Clifford et al. (2007, TICS) の批判 Optimal strategyは「すべてをhigh wagerにする」では？ Incorrect のとき low wager にするのは一見合理的だが，それならばもう１つの選択肢（正答）を選ぶべきである correct incorrect Total High wager 103 17 120 Low wager 19 61 80 122 78 200 実際は信号検出理論の観点からの批判もしているこの課題はawarenessの有無と，optimal strategyの気づきの有無が交絡

例２：Overconfidence現象の問題点回帰直線？ (Erev, 1994) ＝ Overconfidence は判断時の誤差による回帰効果（artifact） Overconfidence 研究では，測定の誤差をできる限り減らす必要性先ほどのoverconfidence の直線を0-50%までに拡張した（もう１つの選択肢の50-100%の確信度を反転させた）のが新しい図。まったく同じデータでもProportion of correct の条件つき分布としてプロットすると，なんとunderconfidenceのグラフになってしまう（回帰の方向が変わってくるから）。

確信度評定の方法論としての利用可能性方法論的に扱うのが難しいが，うまく使うと方法論として非常に優れた側面確信度評定による測定の精度の向上（張, 2007) 識別できなかったモデルの識別「識別できないモデルの識別」という意味は，とりあえず自分の研究を紹介する中で導入

Murayama (in prep)：感情誤帰属手続きへの適用感情誤帰属手続き (affect misattribution procedure; AMP) Payne et al. (2005, JPSP) による開発潜在的な態度を測定する尺度：社会認知測度高い信頼性 (Payne et al., 2005) と予測的妥当性 (Payne et al., 2008, C&E)

基本的な手続き Judgment of the “target” Primeに対する潜在的態度 Prime Target p (“like”| target prime) – p (“like” | no prime) Judgment of the “target” Like -> Left key Dislike -> Right key Primeに対する潜在的態度

自動的な判断過程と統制的（意図的）な修正過程を分離する必要性問題点意図的な反応の修正が入ってしまう：「この文字は『好き』だけど，その前の写真の影響を受けているかもしれない．だから『嫌い』を選ぼう」自動的な判断過程と統制的（意図的）な修正過程を分離する必要性

研究の目的 AMPにおける自動処理・統制処理を分離するためのモデルを提案し，その妥当性を検討する

モデルの提案 “好き”“嫌い”の判断には信号検出モデルを仮定一定の確率（R）で被験者がプライムの影響に気づき反応を修正する反応の修正量をBとする Negative prime条件をベースラインとする閾値 (c) positive prime 閾値の修正量 (B) no prime negative prime d’2 d’1 嫌い好き

モデル式プライムの影響に気づいた場合閾値の修正（向きが逆）プライムの影響に気づかない場合ネガティブプライムへの反応をbaselineとしたときの，それぞれのd’（潜在態度） no prime 条件では意図的な修正はなし

問題点と確信度評定による解決パラメータ推定 R, B, c, d’1, d’2の 5 つ方程式（データ）は３つ解が求まらない！ターゲット判断に確信度評定を用いる（５件法）ことで，方程式（自由度）が増え，解が求まる ※ モデルとデータから得られる予測値の二乗誤差が最小になるように準Newton法でパラメータを推定

確信度評定による自由度の増大 “1” “2” “3” C1 C2 Target Distractor 嫌い好き増加するパラメータ：c2 ３件法の場合 “1” “2” “3” C1 C2 Target Distractor 嫌い好き増加するパラメータ：c2 自由度増大！増えた方程式：p (<c2|target), p (<c2|distractor)

先行研究確信度評定によってモデルの自由度を増大させるアイディア自体は他の研究にも内在社会認知研究では応用がない → 本研究信号検出モデル（自由度０）における正規性の前提の検証 (Green & Swets, 1966) Andrew Yonelinas による二重過程信号検出モデル (for a review, Yonelinas & Parks, 2007, PB) 社会認知研究では応用がない → 本研究他のモデル・論争にも適用可能？回想-熟知性の独立性に関する論争 (e.g., Joordens & Merikle, 1993)

実験１目的：提案した手続きを適用し，意味のある解が得られるかを検討する被験者：北米の大学生26名プライム刺激：ポジティブ写真，ネガティブ写真３２枚ずつ (IAPSより, 覚醒を統制）ターゲット刺激：中国語刺激

75ms

125ms

100ms

Like-dislike judgment

Confidence judgment

1000ms

75ms

125ms

100ms

Like-dislike judgment

Confidence judgment

実験１：結果ターゲットのポジティブ度判断の平均値プライムの主効果が有意（先行研究の再現）

No prime/negative prime ROC曲線と推定値 Positive prime/negative prime No prime/negative prime R = 0.10 B = 1.51 d’1= 0.84 d’2= 0.37

実験２目的：AMPを２回繰り返すことで，プライムへの気づきが増大するかを検討する被験者：北米の大学生54名ターゲット呈示後，すぐにポジティブ度判断（６件法）１週間後に２回目のAMP実験をする

実験２：結果２回目のポジティブ度判断ターゲットのポジティブ度判断の平均値実験１の結果を再現

ROC曲線と推定値 Positive prime/negative prime (Time 2) No prime/negative prime (Time 2) R = 0.08 B = 1.57 d’1= 0.77 d’2= 0.35 R = 0.20 B = 1.51 d’1= 1.11 d’2= 0.52 Time 1 Time 2

実験３目的：明示的に統制処理を高める教示を行うことで，Rの推定値が上昇するかを検討する被験者：北米の大学生14名試行開始前に「ポジティブ度判断が写真によって影響を受けないように」と強く教示 Please try your absolute best not to let the real-life images bias your judgment of the drawings!

実験３：結果ターゲットのポジティブ度判断の平均値教示の効果が見られた ⇒ 潜在的態度の変容？

ROC曲線と推定値 Positive prime/negative prime No prime/negative prime R = 0.66 B = 0.74 d’1= 0.90 d’2= 0.44 ポジティブ度評定に群間差がないのは，潜在的態度 (d’) が変化したのではなく，Rの上昇によるもの

まとめ確信度評定は，方法論上のさまざまな落とし穴がある。しかし，うまく使えば，通常の方法論では解決できない問題を解決する鍵になる．

ご静聴ありがとうございました資料請求・質問などは以下へ村山航 murakou@orion.ocn.ne.jp

他モデルとの比較他モデルとの比較 Payne et al. (personal communication)：AMPに過程分離手続きを適用するモデルを開発中情報をフルに使っていない（no prime条件の結果を使わず） R の過程が生じたときに被験者が何をしているかがわかりにくい条件数が増える（inclusion, exclusion, and baseline conditions)

今後の展望動物における確信度測定方法の整備確信度のモデル化の方法確信度という概念の系統発生的な起源脳における認知プロセスの解明に寄与確信度のモデル化の方法これまでは基本的にパラメータそのものベイズモデルのパラメータ分散という視点 (Daw et al., 2006, Nature) １．確信度そのものをエンコードする部位の発見 (e.g., Kepecs et al., in press, Nature)

確信度と２値反応（正誤）の関係指標 Point-biserial correlationの問題：実際の正誤をそのまま０-１の値として扱ってしまう γ係数は他のメタ記憶研究であるFOK研究ではよく見るが，なぜか目撃証言研究ではそれほどみない．

Point-biserial correlation could be as small as 0.30 (!) 完璧に予測できているように見えても… ここが誤差にこの図は，一見すると完璧に見えるが，point-biserial correlationだと0.30（もしくはそれ以下）になることもありえる．被験者が「３割正答する」といって本当に３割正答したとしても，実際は「１」と「０」からデータは成立しているので，個々の観測値と「３割」の点にはズレが生じてしまい，相関を下げてしまうから． Point-biserial correlation could be as small as 0.30 (!)

確信度と２値反応（正誤）の関係指標 Point-biserial correlationの問題：実際の正誤をそのまま０-１の値として扱ってしまうこうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均． Calibration は，相関係数のように相対的な共変動ではなく，値の絶対的なズレで定義されている点が，相関指標と大きく違うと一般的にはよく言われている．しかし，今回の文脈ではそれは重要ではない．Calibrationは，確信度と個々の観測変数とのズレではなく，それぞれの区間ごとの正答「率」と確信度とのズレを調べているため，誤差が蓄積しない．先ほどの例では，perfect calibrationになる．

Calibration could involve less errors 完全に予測できた場合の直線（仮想）ここだけが誤差に実際の正答「率」 Calibration could involve less errors

確信度と２値反応（正誤）の関係指標 Point-biserial correlationの問題：実際の正誤をそのまま０-１の値として扱ってしまうこうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均． biserial-correlation: ２値反応の背後に正規分布を仮定．

Biserial correlation has less errors 閾値 Biserial correlation has less errors

確信度と２値反応（正誤）の関係指標 Point-biserial correlationの問題：実際の正誤をそのまま０-１の値として扱ってしまうこうした問題を回避した指標 Calibration: 確信度と実際の正答「率」のズレの平均． biserial-correlation: ２値反応の背後に正規分布を仮定． γ係数 (Kruskal, 1958)：順位をもとにした相関 (Nelson, 1984)． γ係数は他のメタ記憶研究であるFOK研究では (Nelsonが薦めているだけあって）よく見るが，なぜか目撃証言研究ではそれほどみない． Olsson (2000) のメタ分析： Calibration 指標を使うと，確信度を使うことで目撃証言の精度は上がっている精度をあげたいならそれに見合った指標を使う必要性