寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
疫学概論 二項分布 Lesson 9.頻度と分布 §B. 二項分布 S.Harano,MD,PhD,MPH.
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
経済統計学 第2回 4/24 Business Statistics
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
統計解析 第7回 第6章 離散確率分布.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計解析 第8回 第7章 2項分布.
Microsoft Excel 2010 を利用した 2項分布の確率計算
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
ホーエル『初等統計学』 第5章 主要な確率分布
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
統計解析 第9回 第9章 正規分布、第11章 理論分布.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
第2章補足Ⅱ 2項分布と正規分布についての補足
統計解析 第8回 第7章 2項分布.
統計学 11/19(月) 担当:鈴木智也.
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学 11/08(木) 鈴木智也.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
統計解析 第1章 データの表現.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
1変量データの記述 経済データ解析 2006年度.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
Basic Tools B4  八田 直樹.
第2日目第1時限の学習目標 順列、組み合わせ、確率の入門的知識を学ぶ。 (1)順列とは? (2)組み合わせとは? (3)確率とは?
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
経営学研究科 M1年 学籍番号 speedster
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
物理フラクチュオマティクス論 応用確率過程論 (2006年4月11日)
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
Microsoft Excel 2010 を利用した 2項分布の確率計算
Presentation transcript:

寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp Twitter: @aterao 「統計入門」第6回 ホーエル『初等統計学』 第4章 確率分布 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp Twitter: @aterao

1.序説 第2章で学んだヒストグラムは,得られたデータの分布を示したもの.経験分布(empirical distribution)と呼ばれる. 第4章で学ぶ確率分布(probability distribution)は,母集団での分布. 母集団ではこうなっているだろうと仮定する,理論的な分布.テキスト図1(p.75)参照.

経験分布の極限としての確率分布 確率分布は理論的に想定される数学的モデルである. 推測統計では,母集団での分布として,特定の確率分布が仮定される. 標本の大きさ(sample size)を十分に大きくすれば,相対度数を用いた経験分布は,確率分布に収束する.(第3章章末問題10参照)

2.確率変数 事象を観察し,なんらかの測定を行う. さいころを2回投げたときの,出た目の和 学生の,1週間あたりの学習時間 こうした測定は繰り返し行うことができる.繰り返しのたびに,変数 X の値が具体的に測定されると考える. 注意:テキストでは変数を小文字の x で表しているが,ここでは大文字を用いる.

1 2 3 例:硬貨を3回投げる実験での,表の出る回数 X HHH HHT HTH THH HTT THT TTH TTT 1 2 3

確率変数(random variable): 定義:標本空間の上で定義された実数値関数.標本点それぞれに実数を対応させる. 直感的には,とりうる値それぞれについて,その値が出現する確率が与えられている変数. 「変数」なのに「関数」? y = f(x) が,対応規則 f と,対応先の変数 y を表現していたのと同じ. 確率変数の決め方については,『統計解析ハンドブック』など参照.

標本空間 実数(表が出た 回数) X TTT TTH HTT 1 THT THH 2 HTH 3 HHT HHH

確率変数(離散型)の表記法 確率変数は,X のような,アルファベットの大文字を用いて表す.実現値は小文字で表す. 確率変数が特定の値 xi をとる確率を,P{X=xi} あるいは単に P{xi} と表す. 例:さいころを1回投げ,「1の目が出る」という事象に実数の1, 「2の目が出る」という事象に実数の2,・・・と対応させた確率変数 X を考えると,

確率分布(離散型) とびとびの値 x1, x2, … をとる確率変数 X を,離散型(discrete type)の確率変数と呼ぶ.たいていは有限個の値を考える. 確率変数と確率との対応の全体を,確率分布(probability distribution)と呼ぶ. 横軸に確率変数 X,縦軸に確率 P{X} をとって図示する.テキスト p.78 の図6および図7参照.

3.確率分布の性質 経験分布について平均と分散を考えたのと同様に,確率分布の平均と分散を考えることができる.

母集団平均:確率分布の平均 第2章で学んだ,分類されたデータから標本平均を求める式を書き換える. (n 回の試行で xi という値が fi 回観察された) 経験分布での相対度数 fi / n は,標本の大きさ(n)を十分に大きくすれば,母集団での確率 P{X=xi} に収束する.

母集団平均:確率分布の平均 標本の大きさを十分に大きくすると,標本平均は母集団平均に収束する. 母集団平均(つまり,確率分布の平均)をギリシア文字 μ (ミュー)で表す. テキスト p.79 (1) 式

母集団分散 分類されたデータから分散を求める式を変形する. (n 回の試行で xi という値が fi 回観察された) n が大きいとき

母集団分散 標本の大きさを十分に大きくすると,標本から計算される分散は母集団分散に収束する. 母集団分散(つまり,確率分布の分散)を σ2 で表す.(ギリシア文字シグマ) テキスト p.79 (2) 式

分散 = 2乗の平均 – 平均の2乗 テキスト p.81 (3) 式

4.期待値 確率分布の平均は,期待値(expected value)とも呼ばれる. 確率分布の期待値といえば,確率分布の平均という意味である. 例:硬貨を1枚投げて,表が出れば100円がもらえるゲームをする.期待値は50円. 非常に多数回の試行を行えば,平均的には50円もらえると期待できる.

確率変数(標本点と実数との対応規則) 「表」→100 「裏」→0 確率分布: P{X=100} = 1/2 P{X=0} = 1/2 「表」→100  「裏」→0 確率分布: P{X=100} = 1/2 P{X=0} = 1/2 期待値(expectation): 確率変数の値それぞれと, その値が出現する確率との 積和 テキスト p.82 (4) 式

確率変数の変換 確率変数 X に何らかの変換 g を行って得られる変数 Y は,やはり確率変数である. Y の期待値は, テキスト p.83 (5) 式

3枚の硬貨を投げ,表が出た枚数のドルがもらえる. 3枚の硬貨を投げ,表が出た枚数の2乗のドルがもらえる.

確率分布の分散は,「平均からの偏差の2乗の期待値」であると言える. という変換であると考えることができる.

期待値の性質1 確率変数に定数を加えると,期待値にも定数が加えられる. 確率変数を定数倍すると,期待値も定数倍される テキスト p.83 (6) 式 テキスト p.83 (7) 式

期待値の性質2 和の期待値は期待値の和(証明は,やや難) 2つの確率変数が独立の場合に限り, 積の期待値は期待値の積 (これはテキストにはない.証明省略) テキスト p.83 (8) 式

第1項について考える(スライド次ページ)

ここでも,第1項について考える (スライド次ページ)

したがって,

同様に, したがって, 参考:『よくわかる統計学 I 基礎編』p.59

5.連続型変数 ある範囲の実数すべてを取りうる確率変数を連続型(continuous type)の確率変数と呼ぶ. 身長 テストの点数 工場で生産される鋼棒の直径 「真の値」を考える.測定に限界があるので,見かけ上は離散型になる.

確率変数(連続型)の表記法 離散型の確率変数の場合と同様に, X のような,アルファベットの大文字を用いて表す. 連続型の確率変数は,ある範囲の実数すべてをとりうるので,特定のひとつの値に対する確率は考えることができない. 確率変数が特定の範囲の値をとる確率(たとえば,P{a≦X≦b} )を考える. 『統計解析ハンドブック』など参照

ヒストグラムの極限としての確率分布 柱すべてを合わせた面積が1になるようにヒストグラムを描くことにする. ひとつの柱の面積は,その階級に属する測定値の,相対度数となる.面積=相対度数 標本の大きさを十分に大きくして,かつ,階級の幅を十分に小さくすれば,ヒストグラムの上端は次第に滑らかな曲線に近づく. この曲線を表す関数 f(x) があるとする.テキスト図8(p.86)参照.

確率密度関数 連続型の確率変数 X がある範囲の値をとる確率が,関数 f(x)によって次のようにあらわされるとき,この関数を確率変数 X の確率密度関数(probability density function)と呼ぶ. 面積=確率:面積が確率に対応する. 連続型変数の確率分布は,確率密度関数によって与えられる.

curve(df(x,10,20), 0,5, xlab="X", ylab="確率密度")

確率密度関数の性質 値は必ず0以上(離散型確率分布のグラフと同様) 全面積は1(全事象の確率は1)

経験分布の極限としての 確率密度関数 確率密度関数は理論的に想定される数学的モデルである. 推測統計では,母集団での分布として,特定の確率密度関数が仮定される. 標本の大きさ(sample size)を十分に大きくすれば,相対度数を用いたヒストグラム(全面積=1)は,確率密度関数に収束する. 確率密度関数によって与えられる確率分布の平均を μ,分散を σ2 で表す.