1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.

Slides:



Advertisements
Similar presentations
計測工学 - 測定の誤差と精度 2- 計測工学 2009 年 4 月 28 日 Ⅱ限目. 授業内容 2.1 数値計算における誤差 2.2 計算過程での誤差 2.3 測定の精度.
Advertisements

統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
もう少し高い位置から 統計応用のひとつの風景. Advanced Data Mining 高度データマイニング 東京工科大学大学院 バイオニクス・情報メディア学専 攻科.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
第1章 統計的方法の性質 高 尚策 (コウ ショウサク) 准 教授 1 富山大学知能情報工学科 「統計学」第1回 オリエンテーション.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
確率と統計 2007 平成 20 年 1 月 10 日 ( 木 ) 東京工科大学 亀田弘之. 復習.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
回答と解説.
第1章 記述統計の復習 統計学 2007年度.
経済統計学 第2回 4/24 Business Statistics
確率と統計2011 平成24年1月12日(木) 東京工科大学 亀田弘之.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
保健統計 橋本.
保健統計演習(統計学 第1回) Hasimoto.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
統計学 第3回 10/11 担当:鈴木智也.
統計学 11/08(木) 鈴木智也.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
1変量データの記述 経済データ解析 2006年度.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
河川工学 -水文統計- 昼間コース 選択一群 2単位 朝位
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
地理情報システム論演習 地理情報システム論演習
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
確率と統計2008 平成20年12月4日(木) 東京工科大学 亀田弘之.
中澤 港 統計学第4回 中澤 港
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
先進的データ分析法 Advanced Data Analysis
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
代表値と散らばり.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

1 章 データの整理 1.1 データの代表値

■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報 = データ 情報の流れ 記号: { x 1, x 2, …, x n } 各種の代表値 統計的推測 (帰納論理:特殊 ⇒ 一般)

■ データの中心を示す代表値 例 : { x 1, …, x 5 } = { 7, 4, 3, 6, 1 } 標本平均値 (Sample Mean) Σ = Sum

順序標本 x [1], x [2], …, x [n] 観測値を昇順(小 → 大)に並べ替えた結果 最小値 = x [1] 最大値 = x [n] 例 : { x [1], …, x [5] } = { 1, 3, 4, 6, 7 } 中央値 (Median) (n が奇数の時 ) → 3 観測値 3 観測値 ←

例 : { x [1], …, x [4] } = { 1, 3, 4, 6 } 中央値 (Median) (n が偶数の時 ) → 半数半数 ←

最頻値 (Mode) 同じ値の個数(度数、頻度)が最も多い 値 例 : { x [1], …, x [9] } = { 1, 3, 3, 4, 4, 4, 6, 6, 7 } 3Ms Mean Median Mode 最多

■ データの広がりを示す代表値 x1x1 x2x2 データ D = (6, 2) 標本平均 M = (4, 4) ||DM|| 標本標準偏差 ×√ (n – 1) 母集団平均 C = (7, 7) 図1図1 45° 線

標本 分散 (Sample Variance) 標本 標準偏差 (Sample Standard Deviation) S ≧ 0 例 : { x 1, x 2 } = { 6, 2 } 標本 平均 値 = ( ) / 2 = 4 、 標本 分散 S 2 = [ ( 6 – 4 ) 2 + ( 2 – 4 ) 2 ] / ( 2 – 1 ) = = 8 標本 標準偏差

■ 偏差に関する基本公式 { x [1], …, x [6] }= { 1, 2, 2, 3, 5, 5 } 重心=標本平均値= 3 代数的証明

任意の実数 c について c = 0 と置くと x1x1 x2x2 データ D = (6, 2) 標本平均 M = (4, 4) ||DM|| 標本標準偏差 ×√ (n – 1) 45 度線上の 任意の点 C = (7, 7) 図1図1 45° 線

チェビシェフ不等式 (平均・標準偏差とデータ 割合) 任意の実数 k > 1 について データの割合 { 標本平均値 ± k× 標本標準偏差 の範囲外 } ≦ 1 / k 2 (k = 2) 平均から 2 標準偏差以上 離れたデータの割合 ≦ 1 / 2 2 = 1 / 4 = 25% (k = 3) 平均から 3 標準偏差以上 離れたデータの割合 ≦ 1 / 3 2 = 1 / 9 ≒ 11% S2S2S3S3S -S -2S-2S -3S-3S 平均

■ 安定した尺度 重心=標本平均値= 3 中央値= 3 重心=標本平均値= 4 データ: {x [1], …, x [7] }= { 1, 2, 2, 3, 4, 4, 5 } データ: {x [1], …, x [7] }= { 1, 2, 2, 3, 4, 4, 12 } 異常値?

■ 四分位点(四分位数、 Quartile ) 最小値 x [1] から最大値 x [n] までのデータを、 個数において 4 等分する 3 点。 5分位点、百分位点、 etc. 範囲 (Range) = 最大値 – 最小値 ( 上の例では 範囲 = 9 – 1 = 8) 四分位範囲 (Inter-Quartile Range) = 第 3 四分位点 - 第 1 四分位点 ( 上の例では 四分位範囲 = 7 – 2.5 = 4.5) { x [1], …, x [7] } = {1, 2, 3, 5, 6, 8, 9} ↑ 最小値 ↑ 最大値 ↑ 中央値 || 第 2 四分位点 = 5 第 1 四分位点 = 2.5↓ 第 3 四分位点 = 7 ↓

分位点の一般公式 (テキストの定義とは異なる。 Excel-Percentile と同じ) 例 (n = 7) :データ { x [1], …, x [7] } = {1, 2, 3, 5, 6, 8, 9} 縦軸の値は観測値が1つ右に進 む毎に 1 / (n – 1) づつ上昇 図2図2 xαxα α α = 0.25 ( = 第 1 四分位点) (n – 1) α + 1 = (7 – 1) = 2.5 番 目 x 0.25 = x [2] + 0.5(x [3] – x [2] ) = (3 – 2) = 2.5 α = 0.5 ( = 中央値 = 第 2 四分位点) (n – 1) α + 1 = (7 – 1) = 4.0 番目 x 0.5 = x [4] + 0.0(x [5] – x [4] ) 不 要 = (6 – 5) = 5