第1回 担当: 西山 統計学.

Slides:



Advertisements
Similar presentations
数理統計学 西 山. 前回のポイント<ルート N の法則> 1. データ(サンプル)の合計値 正規分布をあてはめる ルート N をかけて標準偏差を求める 2. データ(サンプル)の平均値 正規分布を当てはめる 定理8がポイント ルート N で割って標準偏差を求める.
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
数理統計学  第9回 西山.
データ分析入門(7) 第7章 データの操作と比較 廣野元久.
数理統計学 西 山.
統計解析 第7回 第6章 離散確率分布.
第1章 数と式 第4節 集合と命題  8  集合 (第3回).
電子情報工学科5年(前期) 7回目(21/5/2015) 担当:古山彰一
統計学  第7回 西 山.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
データ解析基礎 4. 正規分布と相関係数 keyword 正規分布(教科書:31ページ~38ページ) 正規分布の性質 偏差値
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
統計学 オリエンテーション   担当: 西山.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
数理統計学  第8回 第2章のエクササイズ 西山.
数理統計学  第8回 西山.
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学 第3回 10/11 担当:鈴木智也.
統計学 11/08(木) 鈴木智也.
統計学  第6回 西山.
1時限で理解する 統計の基礎 応用情報処理II 2015/12/4 講師:新居雅行.
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
第4回 カルノー図による組合せ回路の簡単化 瀬戸 目標 ・AND-OR二段回路の実現コスト(面積、遅延)が出せる
数理統計学 第11回 西 山.
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
プログラミング入門2 総合演習課題 2008年 1/7, 1/21 実施 これまでの講義内容についての腕試し
数理統計学 第4回 西山.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
正規分布確率密度関数.
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
中澤 港 統計学第4回 中澤 港
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
数理統計学 西 山.
数理統計学 オリエンテーション   担当: 西山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
プログラミング入門2 総合演習課題 2008年 12/22(月), 2009年 1/14(水) 実施 これまでの講義内容についての腕試し
ex-8. 平均と標準偏差 (Excel 実習シリーズ)
都市・港湾経済学(総) 国民経済計算論(商)
プログラミング入門2 第13回、14回 総合演習 情報工学科 篠埜 功.
統計学  第9回 西 山.
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
数理統計学 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1変量データの記述 (度数分布表とヒストグラム)
数理統計学  第6回 西山.
プログラミング論 相関
ex-8. 平均と標準偏差 (Excel を演習で学ぶシリーズ)
数理統計学  第12回 西 山.
データ分布の特徴 基準化変量 歪度 尖度.
Presentation transcript:

第1回 担当: 西山 統計学

統計的なものの見方とは? 分布とは何か? 分布の特徴とは何か? 今日の目標 統計的なものの見方とは? 分布とは何か? 分布の特徴とは何か?

最初のデータ解析 1、3、2、2、8、3、2、6、2、5 いくつかの数字が混ざっている様子を「分布」していると言 います: 予習と復習の時間 いくつかの数字が混ざっている様子を「分布」していると言 います: 予習と復習の時間 1、3、2、2、8、3、2、6、2、5 最大は8で、最小は1である 2時間勉強する学生が多い データ全体から何が分かりますか? 平均は3.4時間になる 個人差が大きく、ばらつきが目立つ

初歩的なデータ例: 予習と復習の予定時間 1、3、2、2、8、3、2、6、2、5 「データを読む」ということ 初歩的なデータ例: 予習と復習の予定時間 1、3、2、2、8、3、2、6、2、5 では次のデータはどうでしょう? 100世帯の金融資産保有額(単位:万円)

分布の特徴とは何か? 分布の特徴が分かれば、元のデータの形を想像できるは ずです. 中心と広がりに着目 分布のグラフをなくしたらどうするか? グラフの特徴だけを覚えておけばよい 中心と広がりに着目

分布の特徴をつかむ定番 分布の中心の決め方 モード、メディアン、平均値 分布のばらつきの決め方 範囲、平均(絶対)偏差、標準偏差 分布の中心 分布の広がり 偏差とはデータと平均値との差のこと!

ばらつき(散らばり)の分析 標準偏差=ルート分散

大きさとばらつきが統計の基本 データから 平均を引くと 偏差をそのまま平均しても常にゼロです

平均値も標準偏差もデータ全体をまとめたものです! 教科書:14~15ページ ばらつきは標準偏差で測る 平均二乗偏差のこと 平均値も標準偏差もデータ全体をまとめたものです!

これも「分散」と呼んでいます 平均二乗偏差の定義どおりなら、 不偏分散、と呼んでいます 第4章では、こちらを主に使います

理解度チェッククイズ 3個のデータ 64、70、76 の平均値と標準偏差を暗算で求めなさい。 日本の成人男性の身長分布について、 その平均値と標準偏差はどの程度の値か 大雑把に答えなさい。

練習問題 ゲタの公式 と呼んでいます ここまでできたら次の問題

ゲタの公式―平均値― 元のデータ値をXとしたとき のようにして値Yを定義する。このとき 例題1 12頁 統計学の試験の平均点が50点、標準偏差は10点だった。 下駄をはかせるため全学生の得点を1割増しと、更に10点を足した。 平均点はいくらになるか?

ゲタの公式―ばらつき― 元のデータ値をXとしたとき のようにして値Yを定義する。このとき 例題4 18頁 標準偏差は分散の正のルート! 統計学の試験の平均点が50点、標準偏差は10点だった。 下駄をはかせるため全学生の得点を1割増しと、更に10点を足した。 分散はいくらになるか?標準偏差はいくらになるか?

合計の公式―平均値― 合計の平均は平均の合計である。 式で示すのは非常に簡単です 練習問題1 13頁 合計の平均は平均の合計である。 式で示すのは非常に簡単です ある定期試験で英語の平均点が70点、数学の平均点が50点だった。二科目の合計点の平均点は何点か?

合計の公式―ばらつき 合計の分散は分散の合計」になるとは限らない! XとYが独立のときだけ 合計の分散がどうなるか分からないが正解! 分散上昇 分散縮小

これも大事なポイント 例題2 13頁 例題5 19頁 3個のデータ1,2,2の分散を 求めなさい。