第2章 統計データの記述 データについての理解 度数分布表の作成.

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
ヒストグラム 考え方と作り方 産業統計論 2004 年. 量的変数で区分された相対度数 相対度数 下位集団の大きさを全集団に占める割合として示したもの 質的変数と量的変数 たとえば、男女別集計のような場合は、あるかないかどちらかである。 (どちらでも内を含めてもよい) これに対し、身長や体重、テストの点数、資産、所得などは、本来連.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
第2章補足 幹葉表示 統計学基礎 2010年度.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
ローレンツ曲線とジニ係数 度数分布表の応用 ローレンツ曲線の意味 ローレンツ曲線の作成 ジニ係数.
疫学概論 二項分布 Lesson 9.頻度と分布 §B. 二項分布 S.Harano,MD,PhD,MPH.
第1章 記述統計の復習 統計学 2007年度.
QC 7つ道具 【①グラフ:可視化】 データを集め、可視化することによって、状況が把握しやすくなる。
QC 7つ道具 【①グラフ:可視化】 データを集め、可視化することによって、状況が把握しやすくなる。
Excelによる統計分析のための ワークシート開発
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
第1章 記述統計の復習 統計学 2011年度.
統計学 第3回 「データの尺度・データの図示」
第1回 担当: 西山 統計学.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第1章 記述統計の復習 統計学 2010年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
電気基礎実験 <<グラフ処理>>
統計学 10/19 鈴木智也.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
第3章補足 ローレンツ曲線とジニ係数 統計学基礎 2010年度.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
統計解析 第1章 データの表現.
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
月曜3限 1141教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1141教室 担当者: 河田 正樹
統計リテラシー育成のための数学の指導方法に関する実践的研究
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
地理情報システム論演習 地理情報システム論演習
第13回 QC7つ道具(データの可視化・活用) 経営情報論A
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
第3章 統計的推定 (その1) 統計学 2006年度.
第2日目第1時限の学習目標 順列、組み合わせ、確率の入門的知識を学ぶ。 (1)順列とは? (2)組み合わせとは? (3)確率とは?
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
資料の活用.
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
母分散の信頼区間 F分布 母分散の比の信頼区間
都市・港湾経済学(総) 国民経済計算論(商)
本時の目標 相対度数の意味を理解し、二つのデータを比較してその傾向を分析することができる。
代表値と散らばり.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
数理統計学  第6回 西山.
都市・港湾経済学(総) 国民経済計算論(商)
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

第2章 統計データの記述 データについての理解 度数分布表の作成

データについての理解 フローデータ(flow data) 売上高、所得のように、四半期とか1年間などの一定期間の変化量を計測する数値。  売上高、所得のように、四半期とか1年間などの一定期間の変化量を計測する数値。  (表1.1) ストック(stock date)  人口、預金残高のように、その一定時点での水準を示す数値。(表1.2)

データについての理解 時系列データ(time series data) (表1.1、表1.2)  (表1.1、表1.2) クロスセクションデータ(cross section data)  ある期間や時点(t)を固定して、幾つかの異なった対象について調査・実験を行い、観測値を得た場合のデータ。 パネル・データ(panel data)    (表1.3)

データについての理解 離散的データ(discrete data) 一般に各データに対して、その取りうる値として概念的に有限個もしくは加算個の数値          しか存在しない場合、  そのデータは離散的データであるという。 連続的データ(continuous data) ある範囲で連続的どのような値でも取りうるようなデータ

データの整理 試験点数の事例  60 70 60 45 80 60 30 30 55 64  72 24 35 50 65 40 42 10 30 40

データの整理 小さい順に並べてみれば   10 24 30 30 30 35 40 40 42 45 50 55 60 60 60 64 65 70 72 80

順序統計量 Order statistic: 以上のデータを一つの変数 x を用いて、 (ただし、 、n=20)と表現する。 (ただし、       、n=20)と表現する。  この大きさの順に並べたデータを順序統計量の値が呼ばれる。   Maximum(x)=80  Minimum(x)=10

試験得点の度数分布表 階 級 度 数 相対度数 累積相対度数 1 0.05 20-40 5 0.25 0.30 40-60 6 0.60  階 級 度 数 相対度数 累積相対度数 0以上20未満  1  0.05  20-40  5  0.25  0.30  40-60   6  0.60  60-80  7  0.35  0.95  80-100  1.00  100-  0  0.00  合 計  20

専門用語 階級(class)とは、データを分類するための区間である。 上限値と下限値:区間両側の境界値 右半開区間:区間の取り方を左側を含んで、右側を含まない半開区間。 例えば, [0, 20). 第6階級[100, ∞)オ―プンエンドという。  必要に応じて、左半開く区間を用いてもよい。

専門用語 度数(frequency)とは各階級に含まれるデータの数である 。 相対度数(relative)は、各階級 i の度数  をデータの合計数で割った比率である。  nは度数の合計、 mは階級数、  上例ではn=20, m=6  

累積相対度数 Cumulative relative frequencyは、相対度数を階級の順に加えていくもので、第k階級の累積相対度数は第k階級までの相対度数の和となる。

度数分布 Frequency distributionは、データを大きさによっていくつかの階級に分け、各階級に入る度数を明らかにしたものである。度数分布表を通じて、データの全体の分布状況を表すことができる。

度数分布のグラフ

度数分布表作成の注意点 標本数nに対応して、階級数mを適切に定める。 階級幅は第1階級と最後の第m階級を除いて、均一幅にとる。 階級の端点はなるべく簡単な数字とする

階級数に関するスタージェス式 (Sturges, 1926)の公式が参考になる。観測値の数をnとしたとき、階級数m m=1+log2n=1+(log10n)/(log102) 上記の例では、n=20, 常用対数表からlog1020=1.3, log102=0.3 m=1+log1020/log102=5.3 階級数m≒5とする。