統計解析 第1章 データの表現.

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
第2章補足 幹葉表示 統計学基礎 2010年度.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
ローレンツ曲線とジニ係数 度数分布表の応用 ローレンツ曲線の意味 ローレンツ曲線の作成 ジニ係数.
第4章補足 分散分析法入門 統計学 2010年度.
第1章 記述統計の復習 統計学 2007年度.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
統計解析 第7回 第6章 離散確率分布.
第1章 記述統計の復習 統計学 2011年度.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学  第7回 西 山.
統計解析 第8回 第7章 2項分布.
統計学 第3回 「データの尺度・データの図示」
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1章 記述統計の復習 統計学 2010年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
統計解析 第9回 第9章 正規分布、第11章 理論分布.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
統計解析 第8回 第7章 2項分布.
統計学 10/19 鈴木智也.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
1変量データの記述 経済データ解析 2006年度.
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
地理情報システム論演習 地理情報システム論演習
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
第3章 統計的推定 (その1) 統計学 2006年度.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
都市・港湾経済学(総) 国民経済計算論(商)
本時の目標 相対度数の意味を理解し、二つのデータを比較してその傾向を分析することができる。
代表値と散らばり.
統計学  第9回 西 山.
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
第2章 統計データの記述 データについての理解 度数分布表の作成.
都市・港湾経済学(総) 国民経済計算論(商)
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
情報スキル入門 第13週 Excel-3.
Presentation transcript:

統計解析 第1章 データの表現

今日学ぶこと 基本用語 度数分布表 ヒストグラム [有限、無限]母集団 [量的、質的]変量 母数 標本 統計量 相対度数、離散変量 級間隔、連続変量、真の級限界、度数多角形、級中央値、累積度数図

基本用語 30人の同居家族数 1 4 6 2 7 3 量的変量:数字で表せる変量 (ex.人数、金額) 質的変量:数字で表せない変量 4 6 2 7 3 量的変量:数字で表せる変量 (ex.人数、金額) 質的変量:数字で表せない変量 (ex.血液型) 標本:日本人30人 母集団:日本人 変量:同居家族数 母集団:情報が必要とされている人や物の集合 有限母集団:数に限りがある母集団(ex.人) 無限母集団:数に限りがない母集団(ex.博打) 標本:母集団の部分集合で実際にデータを得られたもの 統計量:平均などの推定値 母数:平均などの実際の数値

離散変量 30人の標本の同居家族数 1 4 6 2 7 3 離散変量:特定のいくつかの値をとる (同居家族数であり表の例では0以上の整数)

度数分布 同居家族のデータに対する度数分布表 変量の値 度数 相対度数 7 0.233333 1 9 0.3 2 5 0.166667 3 30人の標本の同居家族数 1 4 6 2 7 3 同居家族のデータに対する度数分布表 変量の値 度数 相対度数 7 0.233333 1 9 0.3 2 5 0.166667 3 4 0.133333 0.066667 6 0.033333 相対度数 =度数 / 合計数 合計30人

棒グラフ 30人の同居家族数 の度数分布表 変量の値 度数 7 1 9 2 5 3 4 6 同居家族のデータに対する棒グラフ (度数分布図) 7 1 9 2 5 3 4 6 同居家族のデータに対する棒グラフ (度数分布図) 各軸の値、意味は必ず書く (必要ならば単位も書く) 表や図には必ず見出しを付ける 一般に、表は上、図は下

? ? 練習問題 さいころを10回ふりました 3,2,3,4,3,5,2,4,6,6 度数分布表 変量 度数 1 2 3 4 5 6 2 3 4 5 6 ? 度数分布の棒グラフ

連続変量 連続変量:任意の値をとり得る変量 30人の標本の所有土地面積(平方メートル) 309.3943 430.8908 189.2709 71.32014293 228.1376 139.7397 17.338 427.4707 264.6121 172.7159713 54.27642 128.4835 528.6089 54.53822 63.04389 289.3790076 102.1777 279.8676 16.70293 182.8751 22.12768 481.1683066 163.1621 87.96185 222.0811 389.7869 107.695 35.85099046 32.6083 138.7269 連続変量:任意の値をとり得る変量

度数分布表 級中央値 = (真の級限界の上限 + 真の級限界の下限) / 2 級間隔の取り方は後述 所有土地面積のデータに対する度数分布表 30人の標本の所有土地面積(平方メートル) 309.3 430.8 189.2 71.3 228.1 139.7 17.3 427.4 264.6 172.7 54.27 128.4 528.6 54.5 63.0 289.3 102.1 279.8 16.70 182.8 22.1 481.1 163.1 87.9 222.0 389.7 107.6 35.8 32.6 138.7 度数分布表 所有土地面積のデータに対する度数分布表 級間隔 真の級限界 級中央値 度数 (平方メートル) 1-100 0.5-100.5 50.5 10 101-200 100.5-200.5 150.5 9 201-300 200.5-300.5 250.5 5 301-400 300.5-400.5 350.5 2 401-500 400.5-500.5 450.5 3 501-600 500.5-600.5 550.5 1 級中央値 = (真の級限界の上限 + 真の級限界の下限) / 2 級間隔の取り方は後述

ヒストグラム 級中央値 度数多角形 土地所有面積のデータのヒストグラム 土地所有面積のデータに対する度数分布表 級間隔 真の級限界 級中央値 度数 (平方メートル) 1-100 0.5-100.5 50.5 10 101-200 100.5-200.5 150.5 9 201-300 200.5-300.5 250.5 5 301-400 300.5-400.5 350.5 2 401-500 400.5-500.5 450.5 3 501-600 500.5-600.5 550.5 1 ヒストグラム 級中央値 度数多角形 0.5 100.5 200.5 300.5 400.5 500.5 600.5 土地所有面積のデータのヒストグラム

級間隔の選び方 土地所有面積のデータに対する度数分布表 級間隔 真の級限界 級中央値 度数 (平方メートル) 1-100 0.5-100.5 50.5 10 101-200 100.5-200.5 150.5 9 201-300 200.5-300.5 250.5 5 301-400 300.5-400.5 350.5 2 401-500 400.5-500.5 450.5 3 501-600 500.5-600.5 550.5 1 各度数が5くらいになるのがよい →級の数が 総度数 / 5 くらいになるのがよい 今回の場合、総度数 / 5 = 30 / 5 = 6

真の級限界の解釈 級間隔 真の級限界 (平方メートル) 1-100 0.5-100.5 101-200 100.5-200.5 201-300 200.5-300.5 301-400 300.5-400.5 401-500 400.5-500.5 501-600 500.5-600.5 級間隔 真の級限界 (平方メートル) 0-100 100-200 200-300 300-400 400-500 500-600 級間隔 真の級限界 (平方メートル) 0- 0-100 100- 100-200 200- 200-300 300- 300-400 400- 400-500 500- 500-600

累積度数図 同居家族数の累積度数図 同居家族数に対する度数分布表 変量の値 度数 相対度数 累積度数 7 0.233333 1 9 0.3 7 0.233333 1 9 0.3 16 2 5 0.166667 21 3 4 0.133333 25 0.066667 27 6 29 0.033333 30 累積度数図 同居家族数の累積度数図

度数分布表 練習問題 変量 度数 累積度数 1 2 3 5 4 7 8 6 10 さいころを10回ふりました。 ? ? 累積度数図

累積度数図 一人あたりの土地所有面積の累積度数図 100.5 200.5 300.5 400.5 500.5 600.5 土地面積のデータに対する度数分布表 級間隔 真の級限界 級中央値 度数 累積度数 (平方メートル) 1-100 0.5-100.5 50.5 10 101-200 100.5-200.5 150.5 9 19 201-300 200.5-300.5 250.5 5 24 301-400 300.5-400.5 350.5 2 26 401-500 400.5-500.5 450.5 3 29 501-600 500.5-600.5 550.5 1 30 累積度数図 100.5 200.5 300.5 400.5 500.5 600.5 一人あたりの土地所有面積の累積度数図

おわり その他トピック 級間隔が等しくないヒストグラム 度数密度