Presentation is loading. Please wait.

Presentation is loading. Please wait.

統計学 講義資料 図表など、テキストに載っている内容は基本的に資料に掲載しません 復習に力をいれること

Similar presentations


Presentation on theme: "統計学 講義資料 図表など、テキストに載っている内容は基本的に資料に掲載しません 復習に力をいれること"— Presentation transcript:

1 統計学 講義資料 図表など、テキストに載っている内容は基本的に資料に掲載しません 復習に力をいれること
 講義資料 図表など、テキストに載っている内容は基本的に資料に掲載しません  復習に力をいれること (練習問題を解いたり、テキストを読みなおす)  成績評価は,期末テストと平常点(小テスト)  質問はオフィスアワー  教科書:『コア・テキスト 統計学 第2版』新世社  参考書:『基本演習 統計学』新世社

2 内容 準備,データの整理(第1章) 測る(第2章:記述統計量) 確率(第3章:確率とは? 確率変数とは?) 離散確率変数とその分布(第4章)
確率(第3章:確率とは? 確率変数とは?) 離散確率変数とその分布(第4章) 連続確率変数とその分布(第5章) 標本調査・標本分布(第6章:比率・割合の調査、標本分布) 推定(第7章:点推定、区間推定、標本サイズの決定) 仮説検定(第8章:仮説検定とは? 平均値の差の検定など) 回帰分析(第9章) 最尤推定法と統計モデル(第10章)

3 法曹界でも統計学は使われている 統計用語が使用された判旨の数(調査対象:米高裁,控訴裁,地裁,請求裁)
『法廷のための統計リテラシー』130頁 表4.6, 近代科学社 統計用語 件数 1982年 件数 2010年 Type I, Type II Error 3 17 散布図 5 50 有意水準 10 1549 分散分析 78 サンプルサーベイ 14 120 最小二乗法 16 81 相関係数 19 159 仮説検定(テスト,帰無,棄却) 32 325 カイ二乗 40 133 回帰分析 46 1131 自由度 47 589 サンプルサイズ 94 1449 統計的推計,統計的有意性 151 1519 中央値 688 17007

4 統計学で何を学ぶのか? 記述統計 標本調査 仮説検定 分析対象の状態をデータによって記述する方法 一部を調べて全体像を探る方法 検証しようとしている仮説 (例:昇給と業績に関連がある)をデータによって検証する方法

5 標本調査 (一部を調べて全体を知る) 全数調査 すべての対象を調査 標本調査 対象の一部を取り出し調査 全数調査の例: 国勢調査
標本調査  (一部を調べて全体を知る) 全数調査 標本調査 すべての対象を調査 対象の一部を取り出し調査 全数調査の例: 国勢調査 日本国内に常住する全ての人口を対象として5年毎(前回は2015年) 標本調査の例: 視聴率調査 誰を選ぶ? 何人に聞けば?

6 東京都知事選挙:2016年夏 開票率 2.85%で当確 すべての票を見ていないのに何故わかる? この速報はどの程度,信頼して良いのか?
朝日新聞DIGITAL より すべての票を見ていないのに何故わかる? この速報はどの程度,信頼して良いのか?

7 米国大統領選挙:2017年秋 米国の新聞社は、単に「当確」を示すのではなく、統計学を活用して勝つ確率を提示 Our best guess right now is that Hillary Clinton is on track to win. Our best guess right now is that Donald Trump is on track to win. 2時間後

8 データの整理 「第1章 1.1, 1.2」 分布とは何か? なぜそんなものが必要か? 度数分布・ヒストグラム 位置に関する代表値
統計基礎 2017/04/11 データの整理 「第1章 1.1, 1.2」 分布とは何か? なぜそんなものが必要か? 度数分布・ヒストグラム 位置に関する代表値 ちらばりに関する代表値 度数分布表からの平均・分散 その他の統計量 データの標準化 分布の形状についての代表値

9 表1.1 (page 3): 1週間後の為替レートの予想
データをながめるだけではわからないこと 表1.1 (page 3): 1週間後の為替レートの予想 みんなの予想は? 自分の予想はみんなと比べて円高より? データを整理する (度数分布表) 分布とは? 定義1.1(4ページ)分布とは? 視覚的にとらえる(ヒストグラム) 図1.1 階級幅を広くすると,その階級の度数が増える可能性がある 階級幅の違いをどのように調整すればよいか? データを眺めるだけでは気づかないことがみえる

10 データ全体の特性を表現する数値 データの位置を表す尺度 平均値(mean), 中央値(median), 最頻値(mode) 広がりを表す尺度 分散(variance), 標準偏差(standard deviation) 貯蓄残高の分布: 図1.2 (page 7) 勤労者世帯の貯蓄残高を代表する数値は? 12ページ参照 最頻値が適切(なぜ?) 平均では実感にあわない。どんな状況? 例題1.1 (page 7)

11 1.2 代表値(データの特性を表す数値) データの位置を表す尺度 平均値(mean), 中央値(median), 最頻値(mode)
広がりを表す尺度 分散(variance), 標準偏差(standard deviation) 分布の形状をみる尺度 歪度(skewness) 分布の対称性 尖度(kurtosis)  分布の広がり・裾の厚さ 度数分布表からの平均・分散(15頁)

12 50+10×𝑧𝑖 その他の代表値 例題 1.2 : ちらばりを比べる
定義 1.7:変動係数 CV ( Coefficient of Variation ) 定義 1.8:データのちらばりに関する代表値 幾何平均 標準化(基準化) 標準化したものを感覚的にわかりやすいように、さらに変換した例 偏差値 50+10×𝑧𝑖 平均を50に、標準偏差を10にする変換 𝑧 1 , …, 𝑧 𝑛 の平均と分散を計算しなさい 𝑤𝑖 = × 𝑧𝑖 として,wi の平均と標準偏差をもとめよ 練習問題 データの分布の形状についての代表値

13 1.1と1.2のまとめ 分布とは何か?  度数分布・ヒストグラム 位置に関する代表値 ちらばりに関する代表値 度数分布表からの平均・分散 その他の統計量 データの標準化 分布の形状についての代表値

14 1.3 母集団と標本 標本調査の例 視聴率調査では 関東地区1800万程度の各世帯すべてを調査せずに,600世帯程度だけをしらべて,関東地区の視聴率としている 政権支持率の調査では ランダムに選ばれた電話番号に電話をして1000世帯ほどの回答が得られるまで続ける。 他には? このような選び方で、正しく調査できているのだろうか?

15 どのように標本を選び出せばよいか? 標本として選び出されたデータの数を標本サイズ,あるいは標本の大きさという 標本を選び出すことを標本抽出という 抽出法:有意抽出法と無作為抽出(ランダムサンプリング)法がある 目的は母集団の分布を反映するような標本を選ぶこと 前者は恣意的,後者は恣意性を排除したもの 無作為抽出法には,系統的サンプリング,多段抽出法,層化抽出法などがある(page 25 を読んでおくこと)

16 母集団 ⋮ 母集団の代表値を推測する (図1.9) 母集団 サンプリング (図1.8)
母集団のすべてを調べないと,その平均や分散はわからない 標本を使って平均や分散をもとめることはできる 「母集団の平均=標本の平均」ならよいのだが。実際は? 母集団 標本 母集団 ・平均 ・分散 標本 母集団の代表値を推測する (図1.9) 母集団の平均や分散を 標本を使って推定する

17 𝑥 = 1 𝑁 𝑖=1 𝑁 𝑥 𝑖 𝑣= 1 𝑁 𝑖=1 𝑁 𝑥 𝑖 − 𝑥 2 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖
母集団のすべてのデータが利用できる場合 平均 (1.1) 分散 (1.2) 𝑥 = 1 𝑁 𝑖=1 𝑁 𝑥 𝑖 𝑣= 1 𝑁 𝑖=1 𝑁 𝑥 𝑖 − 𝑥 2 総数を 𝑁 としている 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 𝑠 2 = 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 標本(母集団の一部)が利用できる場合(標本サイズ 𝑛 ) 平均 (1.1) 分散 (1.3) 𝑛<𝑁 に注意

18 1.3の理解度の確認:以下の各項目を簡単な言葉で説明できますか?
母集団とは何か? 標本とは何か? 母集団と標本の違いは? サンプリングするって? 母集団の代表値を推測するって? 分散を計算する(1.2)と(1.3)は同じでないが、その理由は第6章で明らかになる。


Download ppt "統計学 講義資料 図表など、テキストに載っている内容は基本的に資料に掲載しません 復習に力をいれること"

Similar presentations


Ads by Google