データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第1章 記述統計の復習 統計学 2007年度.
経済統計学 第2回 4/24 Business Statistics
統計解析 第7回 第6章 離散確率分布.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
データ解析 静岡大学工学部 安藤和敏
統計学  第7回 西 山.
第1回 担当: 西山 統計学.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 第3回 10/11 担当:鈴木智也.
統計学 11/08(木) 鈴木智也.
統計学  第6回 西山.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
社会福祉調査論 第9講 母集団の推計 12月14日.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
統計リテラシー育成のための数学の指導方法に関する実践的研究
1変量データの記述 経済データ解析 2006年度.
地理情報システム論演習 地理情報システム論演習
 統計学講義 第11回     相関係数、回帰直線    決定係数.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
確率と統計2008 平成20年12月4日(木) 東京工科大学 亀田弘之.
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
相関分析 2次元データと散布図 共分散 相関係数.
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
第2章 統計データの記述 データについての理解 度数分布表の作成.
プログラミング論 相関
データ分布の特徴 基準化変量 歪度 尖度.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
外れ値検出 Outlier Detection 外れサンプル検出 Outlier Sample Detection
Presentation transcript:

データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数

例 158 160 162 164 164 168 170 220  8人の平均身長が170.75cmとなるが、  220という異常なデータを外したら  7人の平均身長は163.71cmとなる。

レンジ(Range) 与えられたデータから順序統計量  を作ったとき、その最大値と最小値の差として定義される。

四分位偏差(Quartile Deviation) 順序統計量の数列を四等分し、はじめから四分の一のところにある値をX(n/4);四分の三のところにある値をX(3n/4)とすれば、四分位偏差が 項数が奇数: 項数が偶数:  8人身長の例:Q=(168-160)/2=4

レンジと四分位偏差の限界 データの散らばりの度合いを表現するのに、たかだか2個ないし4個の観測値しか使われなく、すべての観測値をもちいていない。

平均偏差 平均偏差が平均絶対偏差とも呼ばれる。  その測度が数学的に扱いにくいなどの欠点がある。

分散(Variance)

標準偏差(Standard Deviation)

度数系列の分散の計算式

分散の性質 平均値の性質3より、つまり より は より          は  のとき最小値となる。分散(標準偏差)は平均値からの散らばりをみる自然な測度である。標準偏差が小さいほど、データは平均値の近くに集中して分布する。

分散の性質1

分散の性質2

分散の性質3 多くのデータでは、平均値から標準偏差の3倍以上離れた値を取ることはあまりない。  即ち、殆どのデータは区間  の中に入る。

変動係数(Coefficient of variation) 異なる母集団の代表値を比較するとき、  変動係数という相対的分散度でみることによって、適正な比較測定が可能となる。  変動係数の値が小さいほど、分散はせまい範囲に密であることを意味する。