1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
確率・統計学の基礎 データの特性を表すパラメータとは? 2 つのデータの関係性を表す式の導出方法.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
中学校段階での 相関関係の指導 宮崎大学教育文化学部 藤井良宜. 概要 現在の学習指導要領における統計の扱い これまでの相関関係の指導 相関関係の指導のポイント 相関関係.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
確率と統計 2007 平成 20 年 1 月 10 日 ( 木 ) 東京工科大学 亀田弘之. 復習.
MS-EXCEL、 OpenCalcを 用いた表計算
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
第2章補足 幹葉表示 統計学基礎 2010年度.
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
第2章 1変量データの記述 統計学基礎 2011年度.
第1章 記述統計の復習 統計学 2007年度.
統計解析 第7回 第6章 離散確率分布.
第1章 統計学の準備 ー 計量経済学 ー.
第3章 2変量データの記述 統計学基礎 2010年度.
第1章 記述統計の復習 統計学 2011年度.
第1回 担当: 西山 統計学.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第1章 記述統計の復習 統計学 2010年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
統計学 第3回 10/11 担当:鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
プログラミング入門2 総合演習課題 2008年 1/7, 1/21 実施 これまでの講義内容についての腕試し
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
地理情報システム論演習 地理情報システム論演習
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第3章 統計的推定 (その1) 統計学 2006年度.
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
プログラミング入門2 総合演習課題 2008年 12/22(月), 2009年 1/14(水) 実施 これまでの講義内容についての腕試し
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
都市・港湾経済学(総) 国民経済計算論(商)
代表値と散らばり.
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
第2章 統計データの記述 データについての理解 度数分布表の作成.
プログラミング論 相関
データ分布の特徴 基準化変量 歪度 尖度.
回帰分析入門 経済データ解析 2011年度.
第1日目第1時限の学習目標 平成21年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期

あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要

1 変量データの記述方法 数値による表現 – 代表値(中心的傾向) 算術平均、メディアン、モード – 散布度(散らばりの傾向) 分散、標準偏差、レンジ、四分位偏差 ※ これらの数値のことを統計量または特性値という。 ※ これらの数値のことを統計量または特性値という。視覚的な表現 – 表による表現(度数分布表) – グラフによる表現(ヒストグラム)

代表値(中心的傾向) ある集団についてのデータ(例えば 50 人のクラ スの身長など)があるとき、集団の特徴をあら わすには、その中心的傾向を示す数値が必要と なる。 代表値(中心的傾向をあらわす数値)として、 – 算術平均 – メディアン(中央値) – モード(最頻値) の 3 種類がある。

算術平均 算術平均 = データの合計 ÷ データ数 (例) 10 人の数学のテストの点数

メディアン(中央値) メディアン → データを大きさの順に 並べたときに真ん中にくる値。データ数 が偶数のときは真ん中の 2 つの値を足して 2 で割る。 点数の低い順に並べ替え 真ん中 この 2 つを足して 2 で割った ( 60 + 70 ) ÷2=65 がメディア ン

モード(最頻値) モード - データの中で最も多く出 てくる値。 10 人のテストの点数の例で は 80 点が 3 人と最も多い。モードは 80 とな る。 † データのとりうる値が多いとき、データの最も多く 出てくるものではなく、度数分布表にしたときに、 最も度数の多い階級の階級値をモードと考える。

散布度(散らばりの傾向) (1) 教員 B チャイムと同時 に教室にくるこ ともあれば、1 5分以上遅れる こともある。 教員 A チャイムの5分後 に必ず教室にくる。 2人の教員はともに平均してチャ イムの5分後に教室にくる

散布度(散らばりの傾向) (2) 2 人の教員の特徴を表現するために、平均だ けでは不十分。 → 散布度(散らばりの傾向をあらわす尺度)の必要性 → 散布度(散らばりの傾向をあらわす尺度)の必要性 散布度(散らばりの傾向をあらわす尺度)と して – 分散 – 標準偏差 – レンジ(範囲) – 四分位偏差 などがある。

分散(1) 分散=偏差 2 乗和 ÷ データ数 偏差 2 乗和-個々のデータから算術平均を引い たもの(偏差)を 2 乗して、すべて加えたもの。 偏差 2 乗和-個々のデータから算術平均を引い たもの(偏差)を 2 乗して、すべて加えたもの。 10 人のテストの点数の例では

分散(2) 算術平均 60 を引 く 偏差 2 乗を求める 合計を求める 640 0 データ数 10 で割 る 64 0 分散

標準偏差 標準偏差 ⇒ 分散の平方根 10 人のテストの点数の例では

( 単位 : 分 ) ※ 2 人の教員が教室に来る時間の 例 教員 A

教員 B となり、教員 B の分散の方が大きいことがわ かる。 標準偏差も である。

レンジ(範囲) レンジ ⇒ データの取りうる範囲 レンジ = 最大値 ー 最小値 レンジ = 最大値 ー 最小値

四分位偏差(1) データを大きさの順(小さい順)に並べ て、 4 分割する点を q 1,q 2,q 3 とする。 このとき、次式で定義される Q を四分位偏 差という。 最小値 最大値 q1q1 q2q2 q3q3

四分位偏差(2) (例) 9 人のテストの点数が次のようになっ ていたとする。 点数の低い順に並べ替え 最小値 q1q1 q 2 (メディア ン) q3q3 最大値 q 1 ⇒最小値と q 2 (メディアン)の真ん中 の値 q 3 ⇒ q 2 (メディアン)と最大値の真ん中 の値

統計量とExcel関数の関係 統計量がそのまま求められるもの – 算術平均 ⇒ 関数AVERAGE – メディアン ⇒ 関数MEDIAN – モード ⇒ 関数MODE – 分散 ⇒ 関数VARP – 標準偏差 ⇒ 関数STDEVP 工夫の必要なもの – レンジ ⇒ 最大値(関数MAX)と最小値(関数MIN)の 利用 – 四分位偏差 ⇒ 四分位数(関数QUARTILE)の利用 (例) q 1 ⇒ = QUARTILE ( 範囲,1) (例) q 1 ⇒ = QUARTILE ( 範囲,1)