<S11> トム と リンダ の 代表性ヒューリスティック ステレオタイプによる基準率の無視 と ベイズ統計学

Slides:



Advertisements
Similar presentations
数理統計学 西 山. 前回のポイント<ルート N の法則> 1. データ(サンプル)の合計値 正規分布をあてはめる ルート N をかけて標準偏差を求める 2. データ(サンプル)の平均値 正規分布を当てはめる 定理8がポイント ルート N で割って標準偏差を求める.
Advertisements

1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
人工知能特論 8.教師あり学習と教師なし学習
インターネット利用と学生の学力  中島 一貴  三国 広希  類家 翼.
<S8> Review: <S1 – S7> 模擬試験の活用法: 学習法の最終確認
入門 計量経済学 第02回 ―本日の講義― ・マクロ経済理論(消費関数を中心として) ・経済データの取得(分析準備) ・消費関数の推定
徳山豪 東北大学情報科学研究科 システム情報科学専攻 情報システム評価学分野
国内線で新千歳空港を利用している航空会社はどこですか?
<S5> 上機嫌な直感君には要注意? プライミング効果 と 認知容易性
統計学 10/25(木) 鈴木智也.
<S7> 直感君の判断の仕組みを熟慮できた? 直感君の3機能 と 自動的な置き換え
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
メディアル教育内容を含む 初級物理学の最適化IT教材開発
執筆者:市川 伸一 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
『演習3・4』ガイド 履修&初回の要点 Seminar 戦略的に行動する頭脳集団
情報は人の行為に どのような影響を与えるか
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
認知の心理 人間の推論と意志決定 今井むつみ.
社会心理学のStudy -集団を媒介とする適応- (仮)
<S10> 市民 と 専門家 の意見の対立 利用可能性ヒューリスティック と 感情ヒューリスティック
H25年5月22日(水) 中央水研 「水産資源のデータ解析入門」 Terrapub
<S9> 偶然が引き起こす愚かなバイアス 少数の法則 と アンカリング効果
1中垣 啓○ ・ 2伊藤 朋子 1早稲田大学 ・ 2早稲田大学大学院 教育学研究科
ベイズ的ロジスティックモデル に関する研究
統計学 12/13(木).
統計リテラシー教育における 携帯端末の利用
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
統計学 第1週 9/27(木) 担当:鈴木智也.
橋本 保健統計演習への準備.
数理統計学 第11回 西 山.
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
Study Design and Statistical Analysis
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
プロジェクトの選択基準 と CBAの役割と限界
心理学 武庫川女子大学文学部教育学科 北口勝也 http: //www. mukogawa-u.ac.jp/~kitaguti.
仮想評価(仮想市場)法 CVM(Contingent Valuation Method)
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
予測に用いる数学 2004/05/07 ide.
法数学における ベイジアンネットワーク(2) ~成書で学ぶ~
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
<S4> 「2 人の自分」に,気づくには? フル回転の直感君 と 錆びつく熟慮様
その他 手法の組合せ.
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
統計学  第9回 西 山.
今後の予定 7日目 11月12日 レポート押印 1回目口頭報告についての説明 講義(4章~5章),班で討論
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
ベイズ音声合成における 事前分布とモデル構造の話者間共有
疫学概論 測定の妥当性 Lesson 20. 評価の要件 §A. 測定の妥当性 S.Harano, MD,PhD,MPH.
仮想評価(仮想市場)法 CVM(Contingent Valuation Method)
『資本主義に希望はある』 の 演習での学び方の例
法数学における ベイジアンネットワーク(2) ~成書で学ぶ~
原口和也 高橋隆一 丸岡章 石巻専修大学 理工学部 情報電子工学科
<4> 狙われたブルーゴールド 環境・市民派の物語
文系学生に対する ベイズ統計学の数理の教育
Presentation transcript:

<S11> トム と リンダ の 代表性ヒューリスティック ステレオタイプによる基準率の無視 と ベイズ統計学 ■ K(14): 14-15章: 代表性ヒューリスティックによるバイアス  1  トム.Wの物語 と 基準率(事前確率)の無視 2 再論: ベイズのルール   <S3> 3 リンダの物語 と 連言錯誤

前回の復習 市民と専門家の意見対立 利用可能性および感情ヒューリスティックの具体例は? 前回の復習 市民と専門家の意見対立 利用可能性および感情ヒューリスティックの具体例は? 利用可能性ヒューリスティックが起こりやすい2つの主因は? 予想外の非利用可能性ヒューリスティックの具体例は? その例では,思い出しやすさと例の数,どっちが強力? 利用可能性カスケードの原因,問題,対策は? 10mを越える高い防潮堤の設置,専門家の意見に同意する? ポピュリズムとは? 衆愚政治とは? なぜ起こる?

本日の読解力Check 3種のトム.Wの実験とは? その含意とは? p.259-263

1 トム.Wの物語 と 基準率(事前確率)の無視 3種のトム.Wの物語 院生トムの専攻?  基準率(事前確率)をベース p.259 確率を,もっともらしさに,置き換える 代表性(=ステレオタイプとの類似性)ヒューリスティック  p.264 =確率(可能性)の見積もりを,代表性に置き換えて判断  基準率や証拠(固有情報)の妥当性を無視  バイアス 

代表性の2つの罪 代表性の光と影  直観が有用な場合でも,改善は可能 代表性に基づく直感的な印象の精度が高い場合 代表性の光と影  直観が有用な場合でも,改善は可能 代表性に基づく直感的な印象の精度が高い場合 ステレオタイプに一面の真実がある場合  p.268 それでも科学的・統計学的視点の導入は強力・効果的 『マネーボール』 勝率向上: 出塁率・長打率・選球眼 p.267 代表性の2つの罪   基準率 ≠ 代表性 基準率の低さを無視  代表性  p.269 固有情報の質の無視  もっともらしければ,疑えない p.271

Q1 代表性ヒューリスティック と 基準率の無視 ニューヨークの地下鉄でニューヨーク・タイムズを読んでい る人を見かけた。この人は,博士号取得者,大卒でない 人,いずれの可能性が高い? p.269 内気で詩が大好きな女学生,可能性の高い専攻は,中国 文学,それとも経営学? p.269 上記2問への正答を増やす方法は? p.270 システム2を刺激: しかめ面,統計学者になったつもりで 第3番目のトム.W問題に正しく回答する方法は? p.272

2 再論: ベイズのルール  <S3> 直感によるバイアスを抑える方法 確率の論理の理解 + <S3> ベイズの定理・ルール 事後オッズ = 事前オッズ(基準率) × 尤度 p.273 注5  18世紀英国のBayesによる定理  高校数学 結果の確率を見積もるためのベイズルールの含意 p.274 妥当な基準率をアンカーにする 固有情報(証拠)の質を疑い,過大評価しない 例: トム.Wの専攻問題  Q1(4) & p.272  れい

Q2 p.273のトムの専攻: <S3Q5>による推定 CS(コンピューター・サイエンス)専攻は全院生の 3% だが,トムの 固有情報からCS専攻の可能性は他分野より 4倍高い と考えた場合 (さらに基準率が80%の場合)は?  11%, 94.1% CS : 他のタイプの事前確率: 3% : 97% (80% : 20%) 各タイプだった場合の CSとみなす条件付き確率 CS or 他 だった場合のトムをCSとみなす確率:80%, 20% ∴ CSでCS=0.3×0.8=0.024, 他でCS =0.97×0.2=0.194 正規化(合計が 1)よる事後確率=0.024 ÷ (0.024+0.194)  約11% 80%: 事後確率= 0.8 × 0.8 ÷ (0.8 × 0.8 + 0.2 × 0.2) = 0.941

A2 トムの専攻: p.273の<注5>による別解 事後確率 = 事後オッズOp ÷ (1+事後オッズOp) 事後オッズOp = 事前オッズOa × 尤度比L  Q2の事前オッズ,尤度比,事後オッズ,事後確率は? 事前オッズOa = 3:97  Oa = 3/97 = 0.03 尤度比L = 4:1  L = 4 事後オッズOp = Oa × L  Op = 12/97 = 0.124 事後確率 = 0.124 / (1 + 0.124)  11% 基準率が80%なら何が変わる? Oa, Op, 事後確率

Q3 ベイズ推定の反復練習例題 p.413の(p.273の<注5>)感染確率問題と,<S3>Q5と同問であるp.295の ひき逃げ問題の,それぞれの事後確率を,Q2の<S3>とテキストの2つの 方法で確かめなさい。 アナタは的中率が25:1の検査で陽性反応が出たが,検査された 人の感染率は600件に1件である。アナタの感染確率は? タクシーによるひき逃げ事件が起きた街を走るタクシーの85%は緑タ クシー,残り15%は青タクシーである。犯人は青タクシーであるとい う証言者の信頼度は,青か緑かを80%の頻度で正しく識別できる。 ひき逃げ犯が青タクシーである確率は?

A3-1 陽性反応者の感染確率 テキストのp.417の説明 Oa = 1 / 599, L = 25  Op = 25 /599 = 0.042 ∴ 事後確率 = 0.042 / 1.042 = 0.040  4% <S3> 上記との関係:Oa = a / 1-a, L = b / 1-b 感染の事前確率 a : 1-a  1 / 600 ; 599 / 600 感染者の陽性率 b : 1-b  25 / 26 : 1 / 26 感染で陽性,, 非感染で陽性 ab, (1-a)(1-b) 事後確率 = ab / {ab + (1-a)(1-b)} = 同上 ( 次頁)

A3-2 犯人が青タクシーである確率 テキストのp.417の説明 Oa = 0.15 / 0.85, L = 0.8 / 0.2 = 4  Op = 0.706 Op= Oa × L = a / 1-a × b / 1- b ∴ 事後確率 = 0.706 / 1.076 = 0.414  41% <S3>のA5参照  結果が上と同じになる理由 a / 1-a = 0.15 / 0.85, b / 1- b = 0.8 / 0.2 事後確率 = ab / {ab + (1-a)(1-b)} = Op / (Op + 1)  分母分子を ÷(1-a)(1-b)

3 リンダの物語 と 連言錯誤 1980年代のリンダ問題 1970年代のトム問題との類似性 トム問題との相違  ひねり p.278 3 リンダの物語 と 連言錯誤 1980年代のリンダ問題 1970年代のトム問題との類似性 基準率,証拠と代表性,確率推定という3実験手続きは同じ ∴ 正答法も,ベイズ流の基準率からの修正という点では同じ トム問題との相違   ひねり p.278 確率の論理的に明白な格差を導入: A ∩ B ⊆ A しかし,85%以上の学生が連言錯覚   p.281  ∴ 熟慮様の失敗: 代表性が論理に勝つ p.279 ∴ もっともたしさ・一貫性を起こりやすさ(確率)に置換 p.282

Q4 リンダ問愛 32歳の独身女性のリンダは,外交的でたいへん聡明。専攻 が哲学だった学生時には,差別や社会正義の問題に強い関 心を持ち,反核運動にも参加したこともある。 p.276 8選択肢のアナタの可能性と代表性の順位,確率は? この実験が最も著名で最も物議を醸しだした理由は? 論理と代表性の戦いに勝つのは,代表性であるという結果 単純化版のリンダは「銀行員である」か「フェミニスト運 動をする銀行員である」かのいずれの可能性が高い? 太郎や花子という現代日本版を作れる?

A4 連言錯誤の確認 A C B Q4の8選択肢の2項目(問3)は,初歩的な論理ルールを含む 単一事象 と もう1つの事象が重なって起こる連言事象の比較  「銀行員」と「フェミニスト運動をする銀行員」 But 錯誤(明白な論理ルールを適用できない) 熟慮様の失敗 A「銀行員」 と C「フェミニスト運動をする銀行員」で面積が大きいのは? B 「フェミニスト運動家」 A C B

Q5 もっともらしさ と 確率予測 1-2, 3-4のいずれの確率が高い? なぜ? p.283 来年,北米のどこかで,死者千人以上の洪水が発生 来年,カリフォルニア州の地震の発生によって,死者千 人以上の洪水が発生 ジェーンは,学校の先生である ジェーンは,歩いて通勤する学校の先生である 1-2, 3-4のいずれがもっともらしいと感じる? なぜ? 2  もっともらしい具体性, 3-4?  小学生なら?

過ぎたるは及ばざるが如し と リンダ問題の構造 リンダ問題の構造の特徴 p.280 確率は合計と同様,平均を得意とする直感君は苦手  ∴ 並列評価でもエラー 合計では単独評価エラーのみ  合計の単独評価エラーの例  過ぎたるは及ばざるが如し シーによるディナーセットA&Bの値付け リストによる野球カード13&10枚の値付け 並列評価では,A > B, 13 > 10 と評価 vs. リンダ But 単独評価では,値付けが逆転  平均価値の低下?

Q6 並列評価エラー と 連言錯誤の例 テキストでの並列評価エラーの例は? どこが連言錯誤? テキストでの並列評価エラーの例は? どこが連言錯誤? シーによるディナーセットA&Bの値付け  p.284 リストによる野球カード13&10枚の値付け p.286   ウインブルドンでのボルグの試合予想 p.287 緑4面・赤2面のサイコロの出目 p.288 1-2は単独評価エラーのみ,3-4はリンダと同様の連言錯誤 並列評価のエラー,特に連言錯誤を減らす質問方法は? 「%表示」から,いくつや何人のような「頻度表示」に変更 p.289

本日の要点 & 次回への準備 代表性ヒューリスティック トム.W問題  基準率の無視と固有情報の質の軽視 修正方法  熟慮様によるベイズのルールの活用 リンダ問題  連言錯誤による並列評価エラー  熟慮様の失敗: 代表性が論理に勝つ傾向 次回準備: K(14) 16-17 章 <S12> 統計学の学習が重要な理由 科学を学んでも,科学的に判断できない理由は?

<S3>の面積アプローチの復習 1 タクシー引き逃げ問題の例: Q3-2  S3Q5, K p.417 事前確率 青 0.15 : 緑 0.85  a:1-a 固有情報 青だった場合の犯人 0.8 : 無実 0.2 b:1-b  緑だった場合の犯人 0.2 : 無実 0.8 1-b:b 事後確率=犯人が青の確率  条件付確率 えれか 青 a 緑1-a 犯人 a b (1-a)(1-b) 無実 a (1-b) (1-a)b

a 1 - a 1 - b b b 1 - b <S3>の面積アプローチの復習 2 事後確率(= 犯人が青の確率) 青の場合の犯人の面積 / (青の場合の犯人の面積 + 緑の場合の犯人の面積) a 1 - a えれか 1 - b b (1-a)(1-b) ab b 1 - b (1-a)b a(1-b)