統計学 第3回 「データの尺度・データの図示」

Slides:



Advertisements
Similar presentations
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advertisements

Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
QC七つ道具 工業高校におけるキャリア教育 高等学校(工 業) パレート図パレート図 特性要因図 ヒストグラム チェックシート 散布図 グラフ 管理図 層別特性要因図ヒストグラムチェックシート散布図グラフ管理図層別.
中学校段階での 相関関係の指導 宮崎大学教育文化学部 藤井良宜. 概要 現在の学習指導要領における統計の扱い これまでの相関関係の指導 相関関係の指導のポイント 相関関係.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
第2章補足 幹葉表示 統計学基礎 2010年度.
第2章 1変量データの記述 統計学基礎 2011年度.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第1章 記述統計の復習 統計学 2007年度.
データ分析入門(7) 第7章 データの操作と比較 廣野元久.
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
統計解析 第7回 第6章 離散確率分布.
第3章 2変量データの記述 統計学基礎 2010年度.
第1章 記述統計の復習 統計学 2011年度.
相関係数 植物生態学研究室木村 一也.
第1回 担当: 西山 統計学.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1章 記述統計の復習 統計学 2010年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
統計解析 第9回 第9章 正規分布、第11章 理論分布.
寺尾 敦 青山学院大学社会情報学部 社会統計 第3回:統計入門の落ち穂拾い 寺尾 敦 青山学院大学社会情報学部
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
マーケティング・リサーチ.
統計学 10/19 鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
統計解析 第1章 データの表現.
クロス集計とχ2検定 P.144.
12月4日 伊藤 早紀 重回帰分析.
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
1変量データの記述 経済データ解析 2006年度.
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
調査結果の集計 集計と尺度 調査企画→調査票の作成・サンプリング→フィールドワーク→集計→分析→調査票の作成
データ分析基礎c(2012年以降入学) 情報編集基礎c(2011年以前入学)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
地理情報システム論演習 地理情報システム論演習
相関分析.
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
中澤 港 統計学第4回 中澤 港
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
analysis of survey data 堀 啓造
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
都市・港湾経済学(総) 国民経済計算論(商)
クロス表とχ2検定.
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
相関分析 2次元データと散布図 共分散 相関係数.
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
数理統計学  第6回 西山.
第2章 統計データの記述 データについての理解 度数分布表の作成.
調査結果の集計 集計と尺度 調査企画→調査票の作成・サンプリング→フィールドワーク→集計→分析→調査票の作成
第1日目第1時限の学習目標 平成21年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

統計学 第3回 「データの尺度・データの図示」 統計学 第3回 「データの尺度・データの図示」 中澤 港(なかざわ みなと) 内線1453,E-mail: minato@ypu.jp

尺度 尺度とは? →データに何らかの値を対応させる基準である。 尺度は, (1)値の差に意味があるかどうか, (2)値の順序に意味があるかどうか, (3)ゼロに意味があるかどうか, によって,名義尺度,順序尺度,間隔尺度,比尺度の4つに分類される。

尺度と変数 研究対象にとりあげる操作概念は変数という形をとる。変数は固有の尺度をもつ。 同じ生データでも,コーディングのやり方次第で変数の尺度は変わりうる。 対応する尺度の種類によって,変数は, 図示の仕方も違うし, 代表値も違うし, 適用できる統計解析手法も違う。

名義尺度 値の差は意味をもたない 値の順序は意味をもたない 質的データに分類基準を与える 性別,職業,居住地など

順序尺度 値の差は意味をもたない 値の順序は意味をもつ 鉱物の強度,地震の震度,尿検査のタンパク検出,「好き」「普通」「嫌い」,出生順位など。 もっともらしい仮定を導入して間隔尺度とみなすこともある

間隔尺度 値の差は意味をもつ 値の順序も意味をもつ ゼロに意味がない(=値の比は意味をもたない) 摂氏温度,西暦年など

比尺度 値の差は意味をもつ 値の順序も意味をもつ ゼロに意味がある(=値の比は意味をもつ) 身長,体重,年齢など 大雑把に言えば,客観的に測定可能な変数の多くは比尺度をもつ

データの図示 離散量の場合 連続量の場合 度数分布図 積み上げ棒グラフ 帯グラフ 円グラフ(ドーナツグラフ) ヒストグラム レーダーチャート 幹葉表示(stem and leaf plot) 箱ヒゲ図(box and whisker plot) 散布図(scatter plot)

離散変数の図示の例1 夫婦の子ども数:20組の夫婦について 2, 3, 1, 0, 3, 2, 2, 1, 1, 1, 2, 2, 1, 3, 2, 1, 0, 2, 1, 1 だった場合,どうまとめるか? 度数分布表としては, 子ども数 夫婦数 0 2 1 8 2 7 3 3 合計 20 図示するとわかりやすい。 8 6 4 2 1 2 3

離散変数の図示の例2 国立社会保障・人口問題研究所が行った「第11回出生動向基本調査・夫婦調査」から,結婚持続期間と子ども数の関係 結婚持続期間 0人 1人 2人 3人 4人 5人以上 0~4年 (1,273) 42.6 44.7 12.1 0.6 - - 5~9年 (1,276) 10.3 21.0 53.6 13.9 1.2 - 10~14年 (1,287) 5.5 11.6 54.2 25.2 3.3 0.3 15~19年 (1,334) 3.7 9.8 53.6 27.9 4.6 0.4 20~24年 (1,419) 2.3 8.1 57.0 28.9 3.4 0.4 25年以上 ( 559) 1.3 12.2 58.3 24.0 3.9 0.4 国立社会保障・人口問題研究所が行った「第11回出生動向基本調査・夫婦調査」から,結婚持続期間と子ども数の関係

離散変数の図示の例3 マーケットシェアなどは,円グラフにするとわかりやすい。日本のパソコン市場におけるメーカ別売上高の1987年と2000年の比較をしたら,下図のようになる(数値は不正確) 1987年 2000年

連続変数の図示の例1 平成元年3月9日から4月2日の東京地区の最低気温 3.2, 3.1, 5.1, 4.8, 8.3, 9.8, 8.3, 6.6, 5.1, 3.8, 5.2, 5.6, 6.5, 5.7, 5.7, 7.4, 6.2, 7.0, 6.7, 5.7, 6.2, 6.0, 8.8, 10.7, 8.5 Lowest temperature in Tokyo Mar-9-1989 to Apr-2-1989 temp Frequency 2 4 6 8 10 12 ヒストグラム

連続変数の図示の例2 平成元年3月9日から4月2日の東京地区の最低気温 3.2, 3.1, 5.1, 4.8, 8.3, 9.8, 8.3, 6.6, 5.1, 3.8, 5.2, 5.6, 6.5, 5.7, 5.7, 7.4, 6.2, 7.0, 6.7, 5.7, 6.2, 6.0, 8.8, 10.7, 8.5 正規確率プロット

連続量変数の図示の例3 平成元年3月9日から4月2日の東京地区の最低気温 3.2, 3.1, 5.1, 4.8, 8.3, 9.8, 8.3, 6.6, 5.1, 3.8, 5.2, 5.6, 6.5, 5.7, 5.7, 7.4, 6.2, 7.0, 6.7, 5.7, 6.2, 6.0, 8.8, 10.7, 8.5 幹葉表示(Stem and leaf plot)では, 3 | 2 1 8 4 | 8 5 | 1 1 2 6 7 7 7 6 | 6 5 2 7 2 0 7 | 4 0 8 | 3 3 8 5 9 | 8 10 | 7

連続変数の図示の例4 平成元年3月9日から4月2日の東京地区の最低気温 3.2, 3.1, 5.1, 4.8, 8.3, 9.8, 8.3, 6.6, 5.1, 3.8, 5.2, 5.6, 6.5, 5.7, 5.7, 7.4, 6.2, 7.0, 6.7, 5.7, 6.2, 6.0, 8.8, 10.7, 8.5 箱ヒゲ図では, 10 ×1.5 8 第3四分位 中央値 6 第1四分位 最小値は×1.5延ばした値より大きいので最小値まで 4