寺尾敦青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp

Slides:

Advertisements

Similar presentations

5 章標本と統計量の分布湯浅直弘. 5-1 母集団と標本 ■ 母集合今までは確率的なことこれからは，確率や割合がわかっていないときに，推定することが目標．個体：実験や観測を行う 1 つの対象母集団：個体全部の集合  ・有限な場合：有限母集合 → １つの箱に入っているねじ．  ・無限な場合：無限母集合.

Advertisements

ホーエル『初等統計学』第７章４節～５節推定（２）寺尾敦青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部「統計入門」第 12 回.

Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布釣り鐘形の曲線－∽から＋ ∽までの値を取る平均 mean ＝中央値 median ＝最頻値 mode 曲線より下の面積は１に等しい.

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

統計学第３回西山. 第２回のまとめ確率分布＝決まっている分布の形期待値とは平均計算平均＝合計 ÷ 個数から卒業！平均＝割合 × 値の合計同じ平均値でも同じ分散や標準偏差でも.

放射線の計算や測定における統計誤差「平均の誤差」とその応用（ 1H) 2 項分布、ポアソン分布、ガウス分布（ 1H ）最小二乗法（ 1H ）

●母集団と標本母集団標本母数母平均、母分散無作為抽出標本データの分析（記述統計学）母集団における状態の推測（推測統計学）

数理統計学(第ニ回）期待値と分散浜田知久馬数理統計学第２回.

寺尾敦青山学院大学社会情報学部 Fisher の直接確率法寺尾　敦青山学院大学社会情報学部

第1回確率変数、確率分布確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

疫学概論二項分布 Lesson 9.頻度と分布 §B. 二項分布 S.Harano,MD,PhD,MPH.

疫学概論ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.

経済統計学第２回４/２４ Business Statistics

確率と統計平成23年12月8日 (徐々に統計へ戻ります).

統計解析第7回第6章離散確率分布.

確率･統計Ⅰ 第12回統計学の基礎1 ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

ホーエル『初等統計学』第８章１節～３節仮説の検定（１）

確率･統計Ⅰ 第11回 i.i.d.の和と大数の法則ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

統計解析第8回第7章 2項分布.

Microsoft Excel 2010 を利用した２項分布の確率計算

標本の記述統計専修大学　経済学部経済統計学（作間逸雄）.

ホーエル『初等統計学』第５章主要な確率分布

第４回 (10/16) 授業の学習目標先輩の卒論の調査に協力する。２つの定量的変数間の関係を調べる最も簡単な方法は？

統計解析第9回第9章正規分布、第11章理論分布.

寺尾敦青山学院大学社会情報学部社会統計第９回：１要因被験者内デザイン寺尾　敦青山学院大学社会情報学部

寺尾敦青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp

疫学概論母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.

大数の法則平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>

放射線の計算や測定における統計誤差「平均の誤差」とその応用（1H) 2項分布、ポアソン分布、ガウス分布（1H）最小二乗法（1H）

確率･統計Ⅱ 第7回.

第2章補足Ⅱ 2項分布と正規分布についての補足

統計解析第8回第7章 2項分布.

統計学 11/19（月）担当：鈴木智也.

ホーエル『初等統計学』第８章４節～６節仮説の検定（２）

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

寺尾敦青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

統計解析第10回１２章標本抽出、１３章標本分布.

統計学 11/08（木）鈴木智也.

統計数理石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布

正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定

統計解析第１章データの表現.

寺尾敦青山学院大学社会情報学部エクセルでの正規分布のグラフの描き方寺尾敦青山学院大学社会情報学部

1変量データの記述経済データ解析　2006年度.

寺尾敦青山学院大学社会情報学部エクセルでの正規分布のグラフの描き方寺尾敦青山学院大学社会情報学部

母集団と標本：基本概念母集団パラメーターと標本統計量標本比率の標本分布

第3回確率変数の平均確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

確率･統計Ⅰ 第3回確率変数の独立性／確率変数の平均ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

第８回授業（5/29日）の学習目標検定と推定は、１つの関係式の見方の違いであることを学ぶ。第３章のWEB宿題の説明

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

正規分布確率密度関数.

確率論の基礎「ロジスティクス工学」第3章鞭効果第4章確率的在庫モデル補助資料

寺尾敦青山学院大学社会情報学部エクセルでの正規分布のグラフの描き方寺尾敦青山学院大学社会情報学部

Basic Tools B4 　八田　直樹.

第２日目第１時限の学習目標順列、組み合わせ、確率の入門的知識を学ぶ。（１）順列とは？（２）組み合わせとは？（３）確率とは？

１.標本平均の特性値２.母分散既知の標本平均の分布 3.大数法則と中心極限定理

標本分散の標本分布標本分散の統計量　　　の定義　　　の性質分布表の使い方　　　分布の信頼区間　

超幾何分布とポアソン分布超幾何分布ポアソン分布.

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

市場調査の手順問題の設定調査方法の決定データ収集方法の決定データ収集の実行データ分析と解釈報告書の作成標本デザイン、データ収集

「アルゴリズムとプログラム」結果を統計的に正しく判断三学期第7回袖高の生徒ってどうよ調査(3)

経営学研究科 M1年学籍番号 speedster

最尤推定・最尤法明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

第5回確率変数の共分散確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

疫学概論ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.

情報の集約記述統計記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。

物理フラクチュオマティクス論応用確率過程論 (2006年4月11日)

確率と統計2007（最終回）平成20年1月17日(木) 東京工科大学亀田弘之.

Microsoft Excel 2010 を利用した２項分布の確率計算

Presentation transcript:

寺尾敦青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp Twitter: @aterao 「統計入門」第６回ホーエル『初等統計学』第４章　確率分布寺尾　敦青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp Twitter: @aterao

１．序説第２章で学んだヒストグラムは，得られたデータの分布を示したもの．経験分布（empirical distribution）と呼ばれる．第４章で学ぶ確率分布（probability distribution）は，母集団での分布．母集団ではこうなっているだろうと仮定する，理論的な分布．テキスト図１（p.75）参照．

経験分布の極限としての確率分布確率分布は理論的に想定される数学的モデルである．推測統計では，母集団での分布として，特定の確率分布が仮定される．標本の大きさ（sample size）を十分に大きくすれば，相対度数を用いた経験分布は，確率分布に収束する．（第３章章末問題10参照）

２．確率変数事象を観察し，なんらかの測定を行う．さいころを２回投げたときの，出た目の和学生の，１週間あたりの学習時間こうした測定は繰り返し行うことができる．繰り返しのたびに，変数 X の値が具体的に測定されると考える．注意：テキストでは変数を小文字の x で表しているが，ここでは大文字を用いる．

1 2 3 例：硬貨を３回投げる実験での，表の出る回数 X HHH HHT HTH THH HTT THT TTH TTT 1 2 3

確率変数（random variable）：定義：標本空間の上で定義された実数値関数．標本点それぞれに実数を対応させる．直感的には，とりうる値それぞれについて，その値が出現する確率が与えられている変数．「変数」なのに「関数」？ y = f(x) が，対応規則 f と，対応先の変数 y を表現していたのと同じ．確率変数の決め方については，『統計解析ハンドブック』など参照．

標本空間実数（表が出た回数） X TTT TTH HTT 1 THT THH 2 HTH 3 HHT HHH

確率変数（離散型）の表記法確率変数は，X のような，アルファベットの大文字を用いて表す．実現値は小文字で表す．確率変数が特定の値 xi をとる確率を，P{X=xi} あるいは単に P{xi} と表す．例：さいころを１回投げ，「１の目が出る」という事象に実数の１，「２の目が出る」という事象に実数の２，・・・と対応させた確率変数 X を考えると，

確率分布（離散型）とびとびの値 x1, x2, … をとる確率変数 X を，離散型（discrete type）の確率変数と呼ぶ．たいていは有限個の値を考える．確率変数と確率との対応の全体を，確率分布（probability distribution）と呼ぶ．横軸に確率変数 X，縦軸に確率 P{X} をとって図示する．テキスト p.78 の図６および図７参照．

３．確率分布の性質経験分布について平均と分散を考えたのと同様に，確率分布の平均と分散を考えることができる．

母集団平均：確率分布の平均第２章で学んだ，分類されたデータから標本平均を求める式を書き換える．（n 回の試行で xi という値が fi 回観察された）経験分布での相対度数 fi / n は，標本の大きさ（n）を十分に大きくすれば，母集団での確率 P{X=xi} に収束する．

母集団平均：確率分布の平均標本の大きさを十分に大きくすると，標本平均は母集団平均に収束する．母集団平均（つまり，確率分布の平均）をギリシア文字 μ （ミュー）で表す．テキスト p.79 (1) 式

母集団分散分類されたデータから分散を求める式を変形する．（n 回の試行で xi という値が fi 回観察された） n が大きいとき

母集団分散標本の大きさを十分に大きくすると，標本から計算される分散は母集団分散に収束する．母集団分散（つまり，確率分布の分散）を σ2 で表す．（ギリシア文字シグマ）テキスト p.79 (2) 式

分散＝２乗の平均 – 平均の２乗テキスト p.81 (3) 式

４．期待値確率分布の平均は，期待値（expected value）とも呼ばれる．確率分布の期待値といえば，確率分布の平均という意味である．例：硬貨を１枚投げて，表が出れば100円がもらえるゲームをする．期待値は50円．非常に多数回の試行を行えば，平均的には50円もらえると期待できる．

確率変数（標本点と実数との対応規則）「表」→100 「裏」→0 確率分布： P{X=100} = 1/2 P{X=0} = 1/2 「表」→100　　「裏」→0 確率分布： P{X=100} = 1/2 P{X=0} = 1/2 期待値（expectation）：確率変数の値それぞれと，その値が出現する確率との積和テキスト p.82 (4) 式

確率変数の変換確率変数 X に何らかの変換 g を行って得られる変数 Y は，やはり確率変数である． Y の期待値は，テキスト p.83 (5) 式

３枚の硬貨を投げ，表が出た枚数のドルがもらえる．３枚の硬貨を投げ，表が出た枚数の２乗のドルがもらえる．

確率分布の分散は，「平均からの偏差の２乗の期待値」であると言える．という変換であると考えることができる．

期待値の性質１確率変数に定数を加えると，期待値にも定数が加えられる．確率変数を定数倍すると，期待値も定数倍されるテキスト p.83 (6) 式テキスト p.83 (7) 式

期待値の性質２和の期待値は期待値の和（証明は，やや難）２つの確率変数が独立の場合に限り，積の期待値は期待値の積（これはテキストにはない．証明省略）テキスト p.83 (8) 式

第１項について考える（スライド次ページ）

ここでも，第１項について考える（スライド次ページ）

したがって，

同様に，したがって，参考：『よくわかる統計学 I 基礎編』p.59

５．連続型変数ある範囲の実数すべてを取りうる確率変数を連続型（continuous type）の確率変数と呼ぶ．身長テストの点数工場で生産される鋼棒の直径「真の値」を考える．測定に限界があるので，見かけ上は離散型になる．

確率変数（連続型）の表記法離散型の確率変数の場合と同様に， X のような，アルファベットの大文字を用いて表す．連続型の確率変数は，ある範囲の実数すべてをとりうるので，特定のひとつの値に対する確率は考えることができない．確率変数が特定の範囲の値をとる確率（たとえば，P{a≦X≦b} ）を考える．『統計解析ハンドブック』など参照

ヒストグラムの極限としての確率分布柱すべてを合わせた面積が１になるようにヒストグラムを描くことにする．ひとつの柱の面積は，その階級に属する測定値の，相対度数となる．面積=相対度数標本の大きさを十分に大きくして，かつ，階級の幅を十分に小さくすれば，ヒストグラムの上端は次第に滑らかな曲線に近づく．この曲線を表す関数 f(x) があるとする.テキスト図8（p.86）参照．

確率密度関数連続型の確率変数 X がある範囲の値をとる確率が，関数 f(x)によって次のようにあらわされるとき，この関数を確率変数 X の確率密度関数（probability density function）と呼ぶ．面積＝確率：面積が確率に対応する．連続型変数の確率分布は，確率密度関数によって与えられる．

curve(df(x,10,20), 0,5, xlab="X", ylab="確率密度")

確率密度関数の性質値は必ず０以上（離散型確率分布のグラフと同様）全面積は１（全事象の確率は１）

経験分布の極限としての確率密度関数確率密度関数は理論的に想定される数学的モデルである．推測統計では，母集団での分布として，特定の確率密度関数が仮定される．標本の大きさ（sample size）を十分に大きくすれば，相対度数を用いたヒストグラム（全面積＝１）は，確率密度関数に収束する．確率密度関数によって与えられる確率分布の平均を μ，分散を σ2 で表す．