<S11> トム と リンダ の 代表性ヒューリスティック ステレオタイプによる基準率の無視 と ベイズ統計学 ■ K(14): 14-15章: 代表性ヒューリスティックによるバイアス 1 トム.Wの物語 と 基準率(事前確率)の無視 2 再論: ベイズのルール <S3> 3 リンダの物語 と 連言錯誤
前回の復習 市民と専門家の意見対立 利用可能性および感情ヒューリスティックの具体例は? 前回の復習 市民と専門家の意見対立 利用可能性および感情ヒューリスティックの具体例は? 利用可能性ヒューリスティックが起こりやすい2つの主因は? 予想外の非利用可能性ヒューリスティックの具体例は? その例では,思い出しやすさと例の数,どっちが強力? 利用可能性カスケードの原因,問題,対策は? 10mを越える高い防潮堤の設置,専門家の意見に同意する? ポピュリズムとは? 衆愚政治とは? なぜ起こる?
本日の読解力Check 3種のトム.Wの実験とは? その含意とは? p.259-263
1 トム.Wの物語 と 基準率(事前確率)の無視 3種のトム.Wの物語 院生トムの専攻? 基準率(事前確率)をベース p.259 確率を,もっともらしさに,置き換える 代表性(=ステレオタイプとの類似性)ヒューリスティック p.264 =確率(可能性)の見積もりを,代表性に置き換えて判断 基準率や証拠(固有情報)の妥当性を無視 バイアス
代表性の2つの罪 代表性の光と影 直観が有用な場合でも,改善は可能 代表性に基づく直感的な印象の精度が高い場合 代表性の光と影 直観が有用な場合でも,改善は可能 代表性に基づく直感的な印象の精度が高い場合 ステレオタイプに一面の真実がある場合 p.268 それでも科学的・統計学的視点の導入は強力・効果的 『マネーボール』 勝率向上: 出塁率・長打率・選球眼 p.267 代表性の2つの罪 基準率 ≠ 代表性 基準率の低さを無視 代表性 p.269 固有情報の質の無視 もっともらしければ,疑えない p.271
Q1 代表性ヒューリスティック と 基準率の無視 ニューヨークの地下鉄でニューヨーク・タイムズを読んでい る人を見かけた。この人は,博士号取得者,大卒でない 人,いずれの可能性が高い? p.269 内気で詩が大好きな女学生,可能性の高い専攻は,中国 文学,それとも経営学? p.269 上記2問への正答を増やす方法は? p.270 システム2を刺激: しかめ面,統計学者になったつもりで 第3番目のトム.W問題に正しく回答する方法は? p.272
2 再論: ベイズのルール <S3> 直感によるバイアスを抑える方法 確率の論理の理解 + <S3> ベイズの定理・ルール 事後オッズ = 事前オッズ(基準率) × 尤度 p.273 注5 18世紀英国のBayesによる定理 高校数学 結果の確率を見積もるためのベイズルールの含意 p.274 妥当な基準率をアンカーにする 固有情報(証拠)の質を疑い,過大評価しない 例: トム.Wの専攻問題 Q1(4) & p.272 れい
Q2 p.273のトムの専攻: <S3Q5>による推定 CS(コンピューター・サイエンス)専攻は全院生の 3% だが,トムの 固有情報からCS専攻の可能性は他分野より 4倍高い と考えた場合 (さらに基準率が80%の場合)は? 11%, 94.1% CS : 他のタイプの事前確率: 3% : 97% (80% : 20%) 各タイプだった場合の CSとみなす条件付き確率 CS or 他 だった場合のトムをCSとみなす確率:80%, 20% ∴ CSでCS=0.3×0.8=0.024, 他でCS =0.97×0.2=0.194 正規化(合計が 1)よる事後確率=0.024 ÷ (0.024+0.194) 約11% 80%: 事後確率= 0.8 × 0.8 ÷ (0.8 × 0.8 + 0.2 × 0.2) = 0.941
A2 トムの専攻: p.273の<注5>による別解 事後確率 = 事後オッズOp ÷ (1+事後オッズOp) 事後オッズOp = 事前オッズOa × 尤度比L Q2の事前オッズ,尤度比,事後オッズ,事後確率は? 事前オッズOa = 3:97 Oa = 3/97 = 0.03 尤度比L = 4:1 L = 4 事後オッズOp = Oa × L Op = 12/97 = 0.124 事後確率 = 0.124 / (1 + 0.124) 11% 基準率が80%なら何が変わる? Oa, Op, 事後確率
Q3 ベイズ推定の反復練習例題 p.413の(p.273の<注5>)感染確率問題と,<S3>Q5と同問であるp.295の ひき逃げ問題の,それぞれの事後確率を,Q2の<S3>とテキストの2つの 方法で確かめなさい。 アナタは的中率が25:1の検査で陽性反応が出たが,検査された 人の感染率は600件に1件である。アナタの感染確率は? タクシーによるひき逃げ事件が起きた街を走るタクシーの85%は緑タ クシー,残り15%は青タクシーである。犯人は青タクシーであるとい う証言者の信頼度は,青か緑かを80%の頻度で正しく識別できる。 ひき逃げ犯が青タクシーである確率は?
A3-1 陽性反応者の感染確率 テキストのp.417の説明 Oa = 1 / 599, L = 25 Op = 25 /599 = 0.042 ∴ 事後確率 = 0.042 / 1.042 = 0.040 4% <S3> 上記との関係:Oa = a / 1-a, L = b / 1-b 感染の事前確率 a : 1-a 1 / 600 ; 599 / 600 感染者の陽性率 b : 1-b 25 / 26 : 1 / 26 感染で陽性,, 非感染で陽性 ab, (1-a)(1-b) 事後確率 = ab / {ab + (1-a)(1-b)} = 同上 ( 次頁)
A3-2 犯人が青タクシーである確率 テキストのp.417の説明 Oa = 0.15 / 0.85, L = 0.8 / 0.2 = 4 Op = 0.706 Op= Oa × L = a / 1-a × b / 1- b ∴ 事後確率 = 0.706 / 1.076 = 0.414 41% <S3>のA5参照 結果が上と同じになる理由 a / 1-a = 0.15 / 0.85, b / 1- b = 0.8 / 0.2 事後確率 = ab / {ab + (1-a)(1-b)} = Op / (Op + 1) 分母分子を ÷(1-a)(1-b)
3 リンダの物語 と 連言錯誤 1980年代のリンダ問題 1970年代のトム問題との類似性 トム問題との相違 ひねり p.278 3 リンダの物語 と 連言錯誤 1980年代のリンダ問題 1970年代のトム問題との類似性 基準率,証拠と代表性,確率推定という3実験手続きは同じ ∴ 正答法も,ベイズ流の基準率からの修正という点では同じ トム問題との相違 ひねり p.278 確率の論理的に明白な格差を導入: A ∩ B ⊆ A しかし,85%以上の学生が連言錯覚 p.281 ∴ 熟慮様の失敗: 代表性が論理に勝つ p.279 ∴ もっともたしさ・一貫性を起こりやすさ(確率)に置換 p.282
Q4 リンダ問愛 32歳の独身女性のリンダは,外交的でたいへん聡明。専攻 が哲学だった学生時には,差別や社会正義の問題に強い関 心を持ち,反核運動にも参加したこともある。 p.276 8選択肢のアナタの可能性と代表性の順位,確率は? この実験が最も著名で最も物議を醸しだした理由は? 論理と代表性の戦いに勝つのは,代表性であるという結果 単純化版のリンダは「銀行員である」か「フェミニスト運 動をする銀行員である」かのいずれの可能性が高い? 太郎や花子という現代日本版を作れる?
A4 連言錯誤の確認 A C B Q4の8選択肢の2項目(問3)は,初歩的な論理ルールを含む 単一事象 と もう1つの事象が重なって起こる連言事象の比較 「銀行員」と「フェミニスト運動をする銀行員」 But 錯誤(明白な論理ルールを適用できない) 熟慮様の失敗 A「銀行員」 と C「フェミニスト運動をする銀行員」で面積が大きいのは? B 「フェミニスト運動家」 A C B
Q5 もっともらしさ と 確率予測 1-2, 3-4のいずれの確率が高い? なぜ? p.283 来年,北米のどこかで,死者千人以上の洪水が発生 来年,カリフォルニア州の地震の発生によって,死者千 人以上の洪水が発生 ジェーンは,学校の先生である ジェーンは,歩いて通勤する学校の先生である 1-2, 3-4のいずれがもっともらしいと感じる? なぜ? 2 もっともらしい具体性, 3-4? 小学生なら?
過ぎたるは及ばざるが如し と リンダ問題の構造 リンダ問題の構造の特徴 p.280 確率は合計と同様,平均を得意とする直感君は苦手 ∴ 並列評価でもエラー 合計では単独評価エラーのみ 合計の単独評価エラーの例 過ぎたるは及ばざるが如し シーによるディナーセットA&Bの値付け リストによる野球カード13&10枚の値付け 並列評価では,A > B, 13 > 10 と評価 vs. リンダ But 単独評価では,値付けが逆転 平均価値の低下?
Q6 並列評価エラー と 連言錯誤の例 テキストでの並列評価エラーの例は? どこが連言錯誤? テキストでの並列評価エラーの例は? どこが連言錯誤? シーによるディナーセットA&Bの値付け p.284 リストによる野球カード13&10枚の値付け p.286 ウインブルドンでのボルグの試合予想 p.287 緑4面・赤2面のサイコロの出目 p.288 1-2は単独評価エラーのみ,3-4はリンダと同様の連言錯誤 並列評価のエラー,特に連言錯誤を減らす質問方法は? 「%表示」から,いくつや何人のような「頻度表示」に変更 p.289
本日の要点 & 次回への準備 代表性ヒューリスティック トム.W問題 基準率の無視と固有情報の質の軽視 修正方法 熟慮様によるベイズのルールの活用 リンダ問題 連言錯誤による並列評価エラー 熟慮様の失敗: 代表性が論理に勝つ傾向 次回準備: K(14) 16-17 章 <S12> 統計学の学習が重要な理由 科学を学んでも,科学的に判断できない理由は?
<S3>の面積アプローチの復習 1 タクシー引き逃げ問題の例: Q3-2 S3Q5, K p.417 事前確率 青 0.15 : 緑 0.85 a:1-a 固有情報 青だった場合の犯人 0.8 : 無実 0.2 b:1-b 緑だった場合の犯人 0.2 : 無実 0.8 1-b:b 事後確率=犯人が青の確率 条件付確率 えれか 青 a 緑1-a 犯人 a b (1-a)(1-b) 無実 a (1-b) (1-a)b
a 1 - a 1 - b b b 1 - b <S3>の面積アプローチの復習 2 事後確率(= 犯人が青の確率) 青の場合の犯人の面積 / (青の場合の犯人の面積 + 緑の場合の犯人の面積) a 1 - a えれか 1 - b b (1-a)(1-b) ab b 1 - b (1-a)b a(1-b)