代表値とは 散布度とは 分布のパラメータ 母集団とサンプル

Slides:



Advertisements
Similar presentations
計測工学 - 測定の誤差と精度 2- 計測工学 2009 年 4 月 28 日 Ⅱ限目. 授業内容 2.1 数値計算における誤差 2.2 計算過程での誤差 2.3 測定の精度.
Advertisements

統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
確率と統計 2007 平成 20 年 1 月 10 日 ( 木 ) 東京工科大学 亀田弘之. 復習.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
第1章 記述統計の復習 統計学 2007年度.
経済統計学 第2回 4/24 Business Statistics
確率と統計2011 平成24年1月12日(木) 東京工科大学 亀田弘之.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学  第7回 西 山.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
群別・男女別の平均.
統計学 第3回 10/11 担当:鈴木智也.
統計学 11/08(木) 鈴木智也.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
対応のあるデータの時のt検定 重さの測定値(g) 例:
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
確率と統計2008 平成20年12月4日(木) 東京工科大学 亀田弘之.
中澤 港 統計学第4回 中澤 港
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
代表値と散らばり.
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
統計学  第9回 西 山.
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
数理統計学 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

代表値とは 散布度とは 分布のパラメータ 母集団とサンプル 平均と分散の計算 代表値とは 散布度とは 分布のパラメータ 母集団とサンプル (C) Katsuhiro Yamada

次のデータがあります 80 75 65 90 83 80 73 問題: こんなデータをどう表現しますか?

これを中央値(median)と言います。 とりあえず小さい順に並べます 65 73 75 80 80 83 90 真ん中の値は 80 です。 これを中央値(median)と言います。

度数を調べます 65 73 75 80 80 83 90 65 73 75 80 83 90 1  1  1  2  1  1 一番多く出たのは2回の 80 です。 これを最頻値(mode)と言います。

これを算術平均(arithmetic mean)と言います。 おなじみの平均を考えましょう 65 73 75 80 80 83 90 65+73+75+80+80+83+90 7 総和 546 をデータ数 7 で割ります。78 です。 これを算術平均(arithmetic mean)と言います。

ちなみに,平均 はこれだけではありません! 幾何平均 (geometric mean) 調和平均 (harmonic mean) 加重平均 (weighted mean) などなど

まとめ 80 75 65 90 83 80 73 大きさ 7 のデータがありました。 これらは 代表値 と呼ばれます。 中央値 = 80 80 75 65 90 83 80 73 大きさ 7 のデータがありました。 中央値  = 80 最頻値  = 80 算術平均 = 78 これらは 代表値 と呼ばれます。

代表値 と言えば通常, 計算しやすい 算術平均 を考えればよいでしょう。 代表値 と言えば通常, 計算しやすい 算術平均 を考えればよいでしょう。

次の2組のデータを考えましょう 80 75 65 90 83 80 73 78 77 77 78 79 78 79 算術平均は両方とも 78 です。 明らかに違うのに,同じ代表値 ですよ!

差異を考えます 80 75 65 90 83 80 73 78 77 77 78 79 78 79 上の例 は下の例 より散らばっています。 80 75 65 90 83 80 73 100 50 78 77 77 78 79 78 79 50 100 上の例 は下の例 より散らばっています。

個々のデータが平均からどれだけ離れているかを計算します。 散らばりの指標を考えます 平均 78 80 75 65 90 83 80 73 100 50 78 77 77 78 79 78 79 個々のデータが平均からどれだけ離れているかを計算します。 50 100

個々のデータの平均からの差の二乗 80 75 65 90 83 80 73 (80-78)2+ (75-78)2+ (65-78)2 平均 78 80 75 65 90 83 80 73 100 50  (80-78)2+ (75-78)2+ (65-78)2 + (90-78)2+ (83-78)2+ (80-78)2 + (73-78)2 = 380

同様に計算すると 平均 78 78 77 77 78 79 78 79 50 100 2×(77-78)2+ 3×(78-78)2 + 2×(79-78)2=2+0+2                        = 4

データ1個当たりの散らばり 80 75 65 90 83 80 73 100 50 78 77 77 78 79 78 79 50 100 上の例 は 380/7= 54.28… 下の例 は 4/7= 0.57…

データ 1個当たりの偏差の2乗を 分散 (Variance) と言います。

分散の平方根をとったものを 標準偏差 (Standard deviation) と言います。

まとめ 代表値 → 平均 散布度 → 分散 で表せます。

平均と分散がわかれば, 正規分布のような分布では 分布を特定化できます。 この意味で,平均や分散を 分布のパラメータ と言います。

平均= 0 分散= 1 標準偏差= 1

母平均 母分散 母集団 サンプル (標本) サンプル平均 サンプル分散 *