2013/04/26.  初等統計学  ポール G. ホーエル ( 著 ), 浅井晃 ( 翻訳 ), 村上正康 ( 翻訳 )  中古なら 1000 円程度.

Slides:

Advertisements

Similar presentations

橋本. 階級値が棒の中央！階級値図での値階級下限階級上限

Advertisements

5 章標本と統計量の分布湯浅直弘. 5-1 母集団と標本 ■ 母集合今までは確率的なことこれからは，確率や割合がわかっていないときに，推定することが目標．個体：実験や観測を行う 1 つの対象母集団：個体全部の集合  ・有限な場合：有限母集合 → １つの箱に入っているねじ．  ・無限な場合：無限母集合.

１標本のｔ検定 3 年地理生態学研究室脇海道卓. ｔ検定とは・帰無仮説が正しいと仮定した場合に、統計量が t 分布に従うことを利用する統計学的検定法の総称である。

第６回適合度の検定問題例１サイコロを 60 回振って、各目の出た度数は次の通りであった。目の出方は一様と考えてよいか。サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説：サイコロの目は一様に出る＝＞それぞれの目の出る確率 p.

1 章データの整理 1.1 データの代表値. ■ 母集団と標本観測個数 n ( または標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本または全数調査 (census) 母集団 (population) 知りたい全体標本 (sample) 入手した情報.

Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布釣り鐘形の曲線－∽から＋ ∽までの値を取る平均 mean ＝中央値 median ＝最頻値 mode 曲線より下の面積は１に等しい.

1 変量データの記述（度数分布表とヒストグラム）経済データ解析 2009 年度後期. あるクラスのテストの点数が次のようになっていたとする。このように出席番号と点数が並んでいるものだけでは、このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.

1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

ヒストグラム５品種松江城出雲大社石見銀山三瓶山アクアスしかしグラフで比較するのはめんどうなところがある端的に１つの数字（代表値）で品種の特徴を表したい.

放射線の計算や測定における統計誤差「平均の誤差」とその応用（ 1H) 2 項分布、ポアソン分布、ガウス分布（ 1H ）最小二乗法（ 1H ）

統計学入門２関係を探る方法講義のまとめ. 今日の話変数間の関係を探るクロス集計表の検定：独立性の検定散布図、相関係数講義のまとめとキーワード「統計学入門」後の関連講義・実習社会調査士.

●母集団と標本母集団標本母数母平均、母分散無作為抽出標本データの分析（記述統計学）母集団における状態の推測（推測統計学）

データ解析基礎 2. 度数分布と特性値 keyword データの要約度数分布表，ヒストグラム分布の中心を表す基本統計量

『基礎理論』（C）Copyright, Toshiomi KOBAYASHI,

回答と解説.

看護学部中澤港統計学第５回看護学部　中澤　港

経済統計学第２回４/２４ Business Statistics

様々な仮説検定の場面 ① １標本の検定 ② ２標本の検定 ③ ３標本以上の検定 ④ ２変数間の関連の強さに関する検定

確率と統計平成23年12月8日 (徐々に統計へ戻ります).

確率･統計Ⅰ 第12回統計学の基礎1 ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

検定Ｐ．１３７.

統計的仮説検定基本的な考え方母集団における母数（母平均、母比率）に関する仮説の真偽を、得られた標本統計量を用いて判定すること。

保健統計演習(統計学第1回） Hasimoto.

標本の記述統計専修大学　経済学部経済統計学（作間逸雄）.

土木計画学第５回（１１月２日）調査データの統計処理と分析３担当：榊原　弘之.

統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える

疫学概論母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.

統計的仮説検定治験データから判断する際の過誤検定結果真実仮説Hoを採用仮説Hoを棄却第一種の過誤（α）（アワテモノの誤り）

確率･統計Ⅱ 第7回.

臨床統計入門（３）箕面市立病院小児科　　山本威久平成２３年１２月１３日.

国試対策橋本　.

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

統計学 11/08（木）鈴木智也.

橋本保健統計演習への準備.

正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定

社会福祉調査論第9講母集団の推計１２月１４日.

計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日　Ⅰ限目.

1変量データの記述経済データ解析　2006年度.

母集団と標本調査の関係母集団標本抽出標本推定標本調査　　（誤差あり）査全数調査　　（誤差なし）査.

データのバラツキの測度レンジと四分位偏差分散と標準偏差変動係数.

看護研究における統計の活用法 Part ３京都府立医科大学　浅野　弘明 2012年11月10日 1.

早稲田大学大学院商学研究科２０１６年１月１３日大塚忠義

母集団と標本：基本概念母集団パラメーターと標本統計量標本比率の標本分布

１.標本平均の特性値２.母分散既知の標本平均の分布 3.大数法則と中心極限定理

第８回授業（5/29日）の学習目標検定と推定は、１つの関係式の見方の違いであることを学ぶ。第３章のWEB宿題の説明

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

代表値とは散布度とは分布のパラメータ母集団とサンプル

確率論の基礎「ロジスティクス工学」第3章鞭効果第4章確率的在庫モデル補助資料

中澤港統計学第４回中澤　港

１.標本平均の特性値２.母分散既知の標本平均の分布 3.大数法則と中心極限定理

他の平均値幾何平均調和平均メデイアンとモード平均値・メデイアン・モードの関係.

確率と統計メディア学部２００8年後期 No.3 平成20年10月16日（木）.

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

早稲田大学大学院商学研究科２０１４年１２月１０日大塚忠義

確率と統計2009 第12日目(A).

データの型量的データ質的データ数字で表現されるデータ身長、年収、得点カテゴリで表現されるデータ性別、職種、学歴

「アルゴリズムとプログラム」結果を統計的に正しく判断三学期第7回袖高の生徒ってどうよ調査(3)

都市・港湾経済学（総）国民経済計算論（商）

母集団と標本抽出の関係母集団標本母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p ：

度数分布表における平均・分散（第1章記述統計の復習補足）

情報の集約記述統計記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。

小標本に関する平均の推定と検定標本が小さい場合，標本分散から母分散を推定するときの不確実さを加味したｔ分布を用いて，推定や検定を行う

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

確率と統計2007（最終回）平成20年1月17日(木) 東京工科大学亀田弘之.

1変量データの記述（度数分布表とヒストグラム）

臨床統計入門（１）箕面市立病院小児科　　山本威久平成２３年１０月１１日.

第2章統計データの記述データについての理解度数分布表の作成.

データ分布の特徴基準化変量歪度尖度.

Presentation transcript:

2013/04/26

 初等統計学  ポール G. ホーエル ( 著 ), 浅井晃 ( 翻訳 ), 村上正康 ( 翻訳 )  中古なら 1000 円程度

DVD は図書館で認証を忘れると悲しいことに！

訂正根源事象⇒根元事象

 試行，事象，確率事象： 6 の目が出る確率： 1/6 事象実験観察

 S: 全事象  根元事象 ( 単一事象）：これ以上分割できない事象  複合事象 2 つ以上の根元事象からなる事象  排反事象共通の根元事象を持たない事象当然どの２つの根元事象も背反である

 S: 全事象， A, A1,A2,…An ∊ S 1. 0 ≦ P(A) ≦ 1 2. A1,A2,…An ．．．が互いに背反事象なら P(A1 ∪ A2 ∪．． ∪ An ∪．．）＝ P(A1)+P(A2)+P( ． )+P(An)+ ．． 3. P(S)=1

 N(A ）：事象 A に含まれる根元事象の個数  全ての根元事象が等しい確率であるなら  S ：根元事象 P(A)= N(A)/N(S)

大切な概念

 P(B|A) ある事象 A を観測したときに事象 B を観測する確率例 ) A: 発熱している B: 風邪をひいている  P(B|A) ⇒発熱を観察しているときに，その人が風邪である確率

 事象 A の発生する確率 0.2 事象 B の発生する確率 0.05 事象 A,B の発生する確率 0.02 S ： 100 人（全事象） A ： 20 人（事象） S ： 100 人（全事象） A ： 20 人（事象） B ： 5 人（事象） A∩B：2人A∩B：2人

S ： 100 人（全事象） A ： 20 人（事象） B ： 5 人（事象） A∩B：2人A∩B：2人

 歪みのないサイコロを投げ，偶数の目が出たときに，その目が 3 の倍数である確率  A ：偶数の目が出る B ：目が 3 の倍数  A={2 の目が出る， 4 の目が出る， 6 の目が出る }  B={3 の目が出る， 6 の目が出る }  A ∩ B={6 の目が出る }

 A={2 の目が出る， 4 の目が出る， 6 の目が出る }  B={3 の目が出る， 6 の目が出る }  A ∩ B={6 の目が出る } ⇒ P(A)=1/2 P(A∩B ） =1/6 ゆえに P(B|A)= P(A∩B)/ P(A)=1/6÷ ½ =2/6=1/3

B: 3 の倍数の目がでる A: 偶数の目がでる 1515

 A ：罹患 ( 発症） P(A ）：ある特定疾患に罹患する確率 ⇒非常に小さい  B: 大学病院に入院する ⇒非常に小さい  しかし P(A|B) が小さいという保証は何もない！

 P(A) ＝万人 1 人  P(B) ＝万人 ( 県民人口）のうち 400 人 ( 病床）  P(A∩B)= 万人 1 人  P(B|A)=P(A∩B)/P(A)= ÷ =1/10 ＝ 0.1

 2 つの事象 A,B が独立事象であるとは  定義 P(A|B)=P(A) または P(B|A)=P(B)

 P(A ∩ B) ＝ P(A)× P(B)  独立のときだけ上の式が成立する  自分の私感ですが，実際の世界で完璧に独立ということはめったにない！

PG ホーエル

 どのように標本を選ぶべきか？  作為抽出なんら科学的な手法も使用できない  無作為抽出（ Random Sampling) 母集団を構成するどの個体も標本に選ばれる確率が等しくなるような抽出方法母集団標本

 母集団：調査対象の数値などを持つ集合  標本  記述統計数値的記述例）平均  注意：母集団の平均：標本の平均母集団標本

 学生のアンケート  電話での選挙予想  老人調査  何が大切か？母集団を構成する台帳  例住民基本台帳  母集団に番号をつける

 老人クラブに入会している人は健康な人たち  老人クラブは過疎地にはすくなくある程度人口がいる場所に限られる。  老人クラブの会長から推薦された人  健康  受け答えができて会の中核になる人  男性  ⇒ この調査結果は信頼できない！

 悉皆調査しっかいちょうさ ⇒国勢調査  標本調査ひょうほんちょうさ  無作為抽出  作為抽出

 基幹統計 ( 旧指定統計）  一般統計 ( 旧承認統計，届出統計） ⇒つまり統計調査をするためには総務省

 調査統計（ 1 次統計）統計を作成することを目的として行われる調査から得られる統計⇒国勢調査，家計調査  業務統計（ 1 次統計）行政上の届出などから得られる記録からの統計⇒人口動態統計  加工統計（ 2 次統計） 1 次統計を利用、加工した統計のこと ⇒国民経済計算や鉱工業指数

 個人面接法（ Interview survey ）  正確で高い回収率、費用がかさむ  配布回収法（留め置き法）  調査員が配布し後に回収  郵送法 (mail survey)  回収率は 30 ％以下  電話法 (Telephone survey)  インターネット調査

 平均値（期待値） Average ， Mean  標準偏差 Standard Deviation ⇒データが平均の周りに散らばっているのか？  分散⇒標準偏差の 2 乗  中央値（ちゅうおうち）  最頻値（もーど）  尖度（せんど）  歪度（わいど）

10 円 50 円平均⇒ 30 円 20 円 40 円 30 円標準偏差＝ 0 標準偏差＝円標準偏差＝円

 偏差値

Wikipedia より

負の歪度左に裾をひいている正の歪度右に裾をひいている

 代表値  平均以外の代表値  メジアン  モード

 分布が左右に歪んでいる場合には必要な概念  左右対称な場合は平均値に一致する

measure of location 分布の位置に関する測度平均、最頻値（モード）、中央値（メジアン） measure of scale 尺度に関する測度その他正規分布と比較して歪度（ Skewness) 尖度（ Kurtosis ）

平均 (x) ：標本平均１ /nΣ i x i を意味します．標準誤差標準偏差をｎの平方根で割ったもの標準偏差標本標準偏差を意味しています．分散の平方根です．平均の周りの散らばりを意味しています．中央値データの真ん中の順位の値です．この場合は１００なので， 50 番目と 51 番目の平均を計算しています．最頻値計算しても意味のないものを計算しています．分析ツールでの計算結果は，離散的なデータや階級に分類されている場合等だけが意味を持ちます．尖度分布の裾の重さになる指標です．歪度左右の偏りを示します．正の場合は右に裾を引き，負の場合は左に裾を引くと言います．分散（ｓ 2 ） : 標本不偏分散です．二乗和を（ n-1 ）で割った形式です．信頼区間正規分布近似計算で両側信頼区間です．（ EXCEL2003) そうでない場合は信頼区間の半分の長さですの，平均 ± この数値が信頼区間です．

 右に裾をひいた分布 ( 歪度が正）単峰（やま１つ）ならモード≦メジアン ≦平均が成立する  左右対称分布の場合は３つ ( 平均，メジアン，モード）は一致して，歪度は０

 右に裾を引く値が正となる  左に裾を引く値は負となる  日本の森林の表層土壌の pH 値有症者発生数の推移流行曲線の例（北海道内で集団発生した腸管出血性大腸菌 O-157 感染症報告書，北海道帯広保健所， 1997 ） idsc.nih.go.jp/training/9kanri/14_minowa.html

2.5 の階級値から階級下限値は０階級上限値は５であることがわかる．つまり 0 歳以上 5 歳未満での死亡数は 322 人であることがわかる．

 最大値, 最小値  階級の数＝ 5-20 程度  目安として  標本の大きさ ▪ 30 程度なら 5 個 ▪ 程度まで  階級の数が多すぎると不規則な凸凹  少なすぎると情報が失われる

Sturges の提案階級の数＝ 1 ＋ (log 10 n / log 10 2) ＝１＋ log 2 n EXCEL では＝１＋ Log( 標本の大きさ,2) と入力すれば計算できるスコット (Scott’s) の提案階級の数＝ 3.5 s / n 1/3 ここで s は標本の標準偏差 EXCEL では＝３＊標本標準偏差 / 標本の大きさ ^(1/3) と入力すれば計算できる Freedman と Diaconis の提案階級の数＝２ × 四分位範囲 / n 1/3

 EXCEL はウソが多い？  売上伝票整理などを主たる目的

500 人になっているか？

① ② ② 重要名義順序スケール

1 ⇒男 2 ⇒女

① ② ③

 BMI の計算 ①

 BMI （ Body Mass Index)  体重 ÷ （身長の２乗）  ① に BMI と記入  ② をクリック  変数⇒体重 ① ②

①

演算 SPPS での標記演算 SPPS での標記＋ ( 加算）＋ X( 乗算） * ー（減算） - ÷( 除算） / べき乗 ** ≠ （不等号） ~= AND ＆ OR ｜ ≦ <= ≧ >= (){}[] 等の区別は無く、すべて () である

 成人の場合 ( 妊婦、乳幼児等を除く）  25 以上を肥満  18.5 未満を低体重  上記以外を標準 25 体重標準肥満 18.5 HIGH 終端

① ②

② ① 判定という変数を記入 ③ 18.5 と 25 を記入 ④

 アンケート等で 5 段階  １＝大変満足した  ２＝やや満足  ３＝ふつう  ４＝やや不満  ５＝不満足順序尺度（変数）⇒平均等は計算しない

 血液型と肥満には関係があるだろうか？  H0: 血液型と肥満には関係が無い  H1 ：血液型と肥満には関係がある

 2 重否定の論理  手順 1. 2 つの仮説を作成する 2. 帰無仮説，対立仮説 3. 帰無仮説が正しいという仮定のもとに，観測された状態が発生する確率を計算 4. 確率が 0.05 （５％）以下なら仮定の帰無仮説が間違っていたとして棄却し，対立仮説を採択様々な方法がある使用する統計量

 検査（スクリーニング）  H0 の仮定の下に現在観測したデータの確率を計算  5% 以下なら H0 を疑い ⇒棄却（ Reject)  H1 を採択する

 χ2 ：カイ 2 乗  Student のｔ  フィッシャーのｚ  F 統計量  順序統計量（マン・ホイットニー等）

 使ってはいけない検定の代表であるが非常にわかりやすい検定方法

 観測値  期待値  もしも判定と血液型が無関係なら 71 の数字の部分は 500×0.336×0.45 ＝ 75.6 人 33.6 ％ 45 ％

 H0 は棄却できない  では H0 なのか？  NO  なにも証明できなかっただけ