行動計量分析 Behavioral Analysis

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
行動計量分析 Behavioral Analysis
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
経済統計学 第2回 4/24 Business Statistics
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
統計学 12/3(月).
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
経済統計 第三回 5/1 Business Statistics
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計学 11/30(木).
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学  第6回 西山.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
数理統計学 第11回 西 山.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
行動計量分析 Behavioral Analysis
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
統計的検定   1.検定の考え方 2.母集団平均の検定.
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
サンプリングと確率理論.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
Presentation transcript:

行動計量分析 Behavioral Analysis 第3回 推測統計学の考え方       inferential statistics 第4章 母集団と標本  Statistical Population and Sampling 第5章 統計的仮説検定  Statistical test of hypothesis

統計学(Statistics)の発展 統計学の始まり(紀元前3000年~2300年)  古代エジプト:ピラミッド建設のための基礎調査  古代中国:人口調査  17世紀頃:国勢調査の学問 status(国家)→statistics 記述統計学( 19世紀末~)Descriptive Statistics  ゴールトン(Francis Galton)、ピアソン(Karl Pearson)  データを要約し調査対象の情報を数学的に記述する方法 推測統計学(1925年) Inferential Statistics フィッシャー(Rinald Aylmer Fisher) 「研究者のための統計的方法」  標本集団の要約値から母集団の要約値を確率的に推測し、それによって母集団の様子を記述する ベイズ統計学・ノンパラメトリック手法 母集団の確率分布を事前に仮定しない方法

記述統計学の目的 Descriptive Statistics 沢山のデータを要約し、中に含まれている情報を把握しやすくするための手段 例:学生100人の体重のデータがある.  その100個の数値持っている情報を簡単に表わしたい データ,データ, データ,データ  要約値 (統計量) 判断 計画 平均値:「100人の学生の体重はだいたい60kgぐらいである」 +標準偏差: 「100人の日本人の体重はだいたい50~70kgである 」

記述統計学と推測統計学 多数データの 母集団の 数学的要約 データ ・記述 無作為 抽出 少数データの (仮想的) 標本集団 数学的要約 のデータ 確率的推測・記述

標本抽出(Sampling)の考え方 知りたいのは,同様の性質を持つデータの全体(母集団population)が持つ性質 全数調査は困難(日本中学生の実力テストの点数) 全数調査は無意味(強度が売り物のPCの破壊検査) 特定の性質を持った個体に偏らないようにして,少数の個体を抜き出す(標本sample) それらの観測値を手に入れる(標本値) 標本の代表値(例えば平均値)を求め,そこから母集団の性質(母数:母集団の平均や分散の値)を推測する 母集団の性質についての確からしさの判断→検定 母集団の記述統計値を推測→推定

目の前のさいころの出目 母集団:このサイコロを何回も振ったときに出る目の出方 標本値:確率変数X={1,2,3,4,5,6} サンプリング:例えば4回サイコロを振る 統計量:4回のサイコロの目の平均値 統計量の実現値がy=1.25であったとする (4回のうち3回が1,1回が2であったことを意味している)

4.2 推測統計の分類(p72) 統計的推定 statistical estimation, inference 4.2 推測統計の分類(p72) 統計的推定 statistical estimation, inference 得られた統計量の実現値をもとに,母集団の確率分布を決めるパラメータ(母数)を推定 一部の中学生の実力テストの結果を用いて,日本の中学生全体の同じ実力テストの点数を推測する 日本の中学生の平均点は60点ぐらいだろう(点推定) 日本の中学生の点数は50点から70点ぐらいだろう(区間推定) 統計的検定 statistical test 母集団の性質に関する何らかの仮説の是非を,得られた統計量の実現値に基づいて判断 一部の中学生に同じテストを5年後に受験させて,次のどちらであるかを判断したい 日本の中学生の実力は5年間で変化していない 日本の中学生の実力は5年間で変化した

4.3点推定 point estimation 17歳の日本人男性全体の平均身長を知りたい(母数:母平均) 10人の17歳男性を標本として抽出し身長の計測値を得る 10個の計測値から,標本の平均値を計算する(169.3) 標本平均の値を用いて,17歳日本人男性の平均身長を推測する > 身長 <- c(165.2, 175.9, 161.7, 174.2, 172.1, 163.3, 170.9, 170.6, 168.4, 171.3) > 身長 [1] 165.2 175.9 161.7 174.2 172.1 163.3 170.9 170.6 168.4 171.3 > mean(身長) [1] 169.36

Population Parameters (p74図4.2)母集団と標本 母集団population 標本抽出 sampling 標本sample 記述 母数 Population Parameters (本当に知りたいもの) 母平均 母分散 母標準偏差 母相関係数 母比率 など 標本統計量 Sample Statistics (標本から計算できるもの) 標本平均 標本分散 不偏分散 標本標準偏差 標本相関係数 標本比率 など 推定 inference

標本抽出に伴う誤差(p75) サイズ2の 標本抽出 sampling 母集団population 標本sample 1,2,6 1,2 1,6 2,6 玉を2個取出し報告 記述 Aさんは数字が書かれた3つの「玉」が入った袋から,玉を出し,数字を報告 標本統計量 Sample Statistics (標本から計算できるもの) 標本平均 推定 inference 母数 Parameter (本当に知りたいもの) 母平均 (1+2+6)/3=3 1.5 3.5 4.0 標本統計値 (統計量の実現値) 標本誤差を含む 誤差を許容限度内に抑える方法 生じうる誤差の大きさの見通し

4.4 推定値がどれぐらい当てになるか?(p77) 標本抽出の方法 単純無作為抽出 抽出データの性質を表わす「確率変数」 4.4 推定値がどれぐらい当てになるか?(p77) 標本抽出の方法 単純無作為抽出 母集団内の各データが等確率で選ばれる方法 実際に取ったサンプルがたまたま「偏る」かも 抽出データの性質を表わす「確率変数」 実際に結果が得られるまで値がわからない変数,同じ手続きを踏んでも再現性がない 確率変数がどのような値をとるかを示す「確率分布」 実際の実現値から作るのではなく,理論的に決められるべきもの ただし,非常の多くの実現値が繰り返し得られるなら,度数分布から確率分布をほぼ知ることができる

推定値の確からしさ 推定値は,そのときの標本の実現値によっていろいろな値を取る:確率変数であり,「標本統計量」と呼ぶ 母集団のばらつきが少なければ,推定値は良く当たる(母集団の確率分布) 標本の確率分布 = 母集団分布 標本の実現値を全て使った平均値を, 「点推定値」とする場合 母集団分布 + 推定量の計算方法 ↓ 推定量の確率分布

4.5.1点推定量(標本統計量)の 望ましさ(p89) 不偏性:標本統計量の分布が,真値を中心に広がっているか? 有効性:標本統計量が狭い範囲に分布しているか?

モンテカルロ法による 標本統計量分布の経験的な検討 #母集団分布を仮定する(正規分布) 4.4.5 curve(dnorm(x,mean=50,sd=10)) 標本平均<-numeric(length=10000) #以下の作業を繰り返す for(i in 1:10000){ #正規母集団から無作為抽出をする 4.4.7 標本 <- rnorm(n=10,mean=50,sd=10) #標本統計量の実現値(標本統計値)を求める    mean(標本) #統計量の実現値の分布を作る4.5.2 標本平均[i] <- mean(標本) }

標本平均(という統計量)の分布 #標本平均値の平均値 #ヒストグラムを相対値で書く #理論分布曲線(標準偏差が√N分の1になる)との比較 mean(標本平均) #ヒストグラムを相対値で書く hist(標本平均,freq=FALSE) #理論分布曲線(標準偏差が√N分の1になる)との比較 curve(dnorm(x,mean=50,sd=10/sqrt(10)),add=TRUE)

偏りのある統計量の例 #以下の作業を繰り返す #10個からなる標本を小さい順にならべる. 整列標本 <- sort(標本) 標本平均B<-numeric(length=10000) #以下の作業を繰り返す for(i in 1:10000){ 標本 <- rnorm(n=10,mean=50,sd=10) #10個からなる標本を小さい順にならべる.  整列標本 <- sort(標本) #初めの9個を取り出し,平均を残す 標本平均B[i] <- mean(整列標本[1:9]) } mean(標本平均B) #[1] 48.26386 hist(標本平均B,freq=FALSE)