マンガでわかる統 計学(後半) 保田ゼミ 小樽チームサブゼミ 2013.4.17 4 講 担当:荒谷.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
統計学入門 4-10章 チーム小樽 担当:いぬき.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
数理統計学 西 山.
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
データ解析 静岡大学工学部 安藤和敏
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
数理統計学  第8回 第2章のエクササイズ 西山.
数理統計学  第8回 西山.
統計学 12/13(木).
統計学  第6回 西山.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
統計解析 第1章 データの表現.
対応のあるデータの時のt検定 重さの測定値(g) 例:
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
春の統計学・計量経済学勉強会 第1回:2017年2月21日(火) 市野泰和
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
相関分析.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
正規分布確率密度関数.
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
数理統計学 西 山.
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
数理統計学  第12回 西 山.
Presentation transcript:

マンガでわかる統 計学(後半) 保田ゼミ 小樽チームサブゼミ 講 担当:荒谷

目次  データの種類  ヒストグラム  基準値  偏差値  確率密度関数  標準正規分布  カイ二乗分布  二変数の関係性

データの種類

 カテゴリーデータ 測れないデータ ex. とても好き〜まあまあすき〜きらい 目盛りが等間隔じゃない!  数量データ 測れるデータ ex. 年齢、数などの数値

クイズ!カテゴリー OR 数量?  気温  出身県  柔道の段位  体重  「株式市場と M&A 」の発行部数 数量データ  天気 数量データ カテゴリーデータ 数量データ カテゴリーデータ

ヒストグラム

ラーメン屋のラーメンっていくら? うーん、目がし ばしばしちゃう ね!

ヒストグラムが便利 度数=個数

相対度数は全体の中の何%占めているかっ てこと

ヒストグラムのイメージはビル!

CHALLENGE TIME! SHEET1 ツール → 分析ツール → ヒストグラム

基準値

テストの点数を比較しよう!  生物で73点  英語で73点  どっちがいい点数??

基準値=点数に価値をつける  みーんな点数高い生物と  みーんな点数低い英語では  73点の価値が違う!  基準値で比較!

基準値のとくちょー  平均はいつも0  標準偏差はいつも1  どんな単位でも、満点が何点でもくらべ れちゃう

 Challenge time!  関数= STANDARDIZE  Sheet2  Control + D キー をフル活用してね!

 同じ73点でも、基準値が 高い方が価値のある点数っ てこと!

偏差値

 みんなが直面してきた偏差値  実は 偏差値=基準値 × 10+50  50が真ん中になるように工夫されてる だって100点満点だからその方がわかりや すいもんね!

CHALLENGE TIME!

確率密度関数

確率密度関数のグラフ

確密度関数  平均を中心に左右対称  平均と標準偏差に影響される

ばらついてるね

データが密集してるね! 本ゼミの先生のレク チャーでも、こんな の出てきたよね。収 益の年ごとのばらつ き具合で。

でも、基準がちがうと比べにくいよね?  じゃあ基準化しよう  つまり、基準値に直しちゃおう ★

標準正規分布

これを標準正規分布っていいます

だからなんだよっておもうでしょ?

面積=確率なのよ! ちなみに、全部の 面積が1 半分だと0.5

確率のぶれ具合がとっても視覚的にわ かるよね (^^)

標準正規分布表 この面積を求められるよ! 面積=確率だからね〜! この面積を求められるよ! 面積=確率だからね〜!

 Z =1.96のときは  Z =1.9 + 0.06  1.9と0.06が交差するところを見る! つまり、 47.5% ってこと! つまり、 47.5% ってこと!

カイ二乗分布

自由度は傾きのようなものと思ってね

どうやって使うかというと・・・

すでにわかっている確率から、横軸の目盛 りを推定できる!

2変数の関係性

2変数の関連  つまり、回帰分析とか!

どのくらい関連しているか

でもこれってかなり適当じゃない? 統計のくせして!

無相関の検定  本当にその2変数が相関しているのか?  相関係数からしらべることができる!  でも直接「相関してます」はできなくて  無相関かどうかを調べる

たとえば相関係数 のとき

標本が ってことは母集団は・・・?  標本には弱い相関あり  でも、母集団はどうなの?  ほんとに知りたいのは母集団 の相関だよね

無相関検定スタート!  まず、母集団の相関係数が0になると仮 定する (帰無仮説)  もし、これが証明できなければ(あるい は嘘だって証明できたら)、母集団の相 関が0ではない=相関があるってこと!

母集団の相関が0だと仮定しているから、 確率密度関数のグラフはこんな感じ

 有意水準 それがありえるか、ありえないかってこと 大抵5%で考えられる Ex. 100日のなかで5日しか雨降らない地域 で、 今日雨が降るってのは普通に考 えてありえないよなーってはなし。

じゃあ、相関係数0ってのはありえるのか? 両端合わせて5% 計算したら相関係数 のところが境界

 5%以下だと「ありえない!」 判定  5%以上だと「あり得る」判定

じゃあ は? 5%のときより大きいから、「あ りえる判定」

つまり、無相関  「相関係数が0」がありえるから、意 味のある相関とは言えない  「母集団が相関0」がありえるからね

オワリ!  とばしてる項目もあります。  でも流し読みなら1時間で読めちゃうから、ぜひ読んでね!