「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
行動計量分析 Behavioral Analysis
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学  第6回 西山.
1時限で理解する 統計の基礎 応用情報処理II 2015/12/4 講師:新居雅行.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
相関分析.
リサーチカンファ 29 Aug, 2017.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
第4章 統計的検定 (その2) 統計学 2006年度.
情報の授業 xx高の生徒ってどうよ調査の分析 Go.Ota アンケート調査なんて小学校からやっているから平気、平気!
クロス表とχ2検定.
統計学  第9回 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
サンプリングと確率理論.
数理統計学  第12回 西 山.
Presentation transcript:

「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3) 三学期 第7回 袖高の生徒ってどうよ調査(3)    結果を統計的に正しく判断 グラフで差があるので違うんじゃないの ディズニーシーを好きな女子と男子は違いがあるの? 本資料の信頼区間の図等は、統計学習オンライン(http://stat.doscience.jp)を使用して作成しています。

統計的推論とは 母集団から抽出された標本に基づき,母集団分布そのもの,あるいは母集団分布が想定されているときには,母集団における集団的特性値を引出すための方法をいう。その代表的なものは推定と検定である。 人間の感覚的な判断ではなく、ものごとが起こりうる確率をもとにして、データを判断したり、推測したりすること。

簡単なところから: 相関:ものごとの関連の強さ スマホの利用時間とLINEの使用時間は関係があるの? 関係の強さ =相関係数 数学Bあたりで やっている?

相関係数 r 相関が完全にある y = ax r = 1.00 相関の強さ 1.00 ≧ |r| ≧ 0 1.00 ≧ r ≧ -1.00 相関がない バラバラ r = 0

Excelを使った相関係数の求め方

Excel相関係数の結果 | r | = 0.7~1   かなり強い相関がある | r | = 0.4~0.7  やや相関あり | r | = 0.2~0.4  弱い相関あり | r | = 0~0.2   ほとんど相関なし 書き方例: xxxxとyyyyyの関係を見るために、相関分析を行った。その結果、xxxxとyyyyの間には、高い正の相関が認められた ( r = .747) xxxxとyyyyyの関係を見るために、相関分析を行った。その結果、xxxxとyyyyの間には、ほとんど相関がなかった ( r = .011)

グループで違いがあるか判断する: t検定 グループ間の人数の違いを比較する(クロス集計) 男女でゲーム時間に違いはあるの? 違いの証明 数学Bあたりで やっている?

事前知識:サンプリング調査 全数調査は難しい ⇒ 一部を取り出して調査 一部の調査から全体をどうやって推定するか? 全数調査: 母集団 全数調査は難しい ⇒ 一部を取り出して調査  一部の調査から全体をどうやって推定するか? 全数調査: 母集団 標本調査: 標本/サンプル 標本の平均 母集団の 本当の平均 取り出し

事前知識の事前知識 世の中の自然のものは正規分布する 平均 = 50 標準偏差 = 10 の分布 平均 = 50 標準偏差 = 20 の分布

事前知識:標本の平均 世の中の自然のものは正規分布する 母集団の平均 = 50 (本当の平均) 運良くこのあたりからサンプル 標本の平均 = 50 運悪く、このあたりからサンプル 標本の平均 = 27

事前知識:標本の平均の分布 母集団の平均 = 50 (本当の平均) 平均 平均 平均 平均 平均 何回も調査すると 結構バラバラ

事前知識:信頼区間: 母集団の平均の推定 母集団の平均 = 50 (本当の平均) 標本調査で出た平均に幅を持たせれば本当の平均が入っているだろう

事前知識: どれだけ幅をもたせるか 通常: 信頼区間 95% を使用。 おおよそ、この数式の範囲を 母集団の本当の平均と考えよう 事前知識: どれだけ幅をもたせるか 通常: 信頼区間 95% を使用。 おおよそ、この数式の範囲を 母集団の本当の平均と考えよう 通常: 信頼区間 95%の意味 例えば、100回標本調査をすれば、95回は、正しい 母集団の平均を示すことができるが、運が悪ければ 5回は誤った母集団の平均を示す。

グループで違いがあるか判断する: t検定 女子母集団: 男子母集団: 二つの標本調査の結果から、それぞれの母集団の平均が違っているか証明する 男子の本当の平均 女子の本当の平均 男子標本調査: 標本/サンプル 男子標本の平均 女子標本調査: 標本/サンプル 女子標本の平均 二つの標本調査の結果から、それぞれの母集団の平均が違っているか証明する

t検定:帰無仮説 実は、二つの集団に差が無く母集団の平均は一緒。 ただし標本調査した結果がたまたま違っていた。 女子母集団: 男子母集団: 男子の本当の平均 =女子の本当の平均 男子標本調査: 標本/サンプル 男子標本の平均 女子標本調査: 標本/サンプル 女子標本の平均

t検定:帰無仮説:標本調査の結果がたまたま違う

Excelを使ったt検定

Excelのt検定の結果 実は、平均が同じと仮定した母集団から、二つの標本調査をした場合に、このように平均が異なるものが選ばれる確率は 0.0017 = 1.7 % これは偶然選ばれることはないから、もともと母集団が平均が等しいという考えが間違っているんじゃないの = 帰無仮説の廃棄 = もともと母集団に差があった。

Excelのt検定の結果の判断:信頼水準 二つの標本調査をした場合に、このように平均が異なるものが選ばれる確率は p < 0.05 5% より小さい場合 p < 0.01 1% より小さい場合  このぐらいだと、偶然選んだといえないので、帰無仮説の廃棄 この確率が5%以下や、1%以下のことを信頼水準といいます。 5%以上又は10%以上だと、偶然でもそのぐらいの差はでるということで違わないという判断 信頼区間と信頼水準 信頼区間と信頼水準は全く別のものです。 一般的に計算すると、二つの標本データがあった時に、その時、その信頼区間が1/3以上 重ならないようだと、その二つのデータの抽出される確率(信頼水準)は5%ぐらいになります。

Excelのt検定の結果の判断の書き方 xxxxとyyyyの間で、平均値間に差があるか対応のないt検定を行ったところ5%水準で有意な差が認められた。 xxxxとyyyyの間で、条件間で平均値間の差について対応のあるt検定を実施した。結果、統計的に有意な差は認められなかった。 注意: t検定は、有意な差があるかどうか検定するだけであって、差が大きいや小さいを判断するものではありません。

ようやく今日の課題 少ない時間ですが すでに作成した、袖高の生徒ってどうよパワポに ・相関計算できるもの ・t検定できるもの

来年度の課題研究のデータの分析に向けて(1) いろいろなt検定 対応のない場合 (今回説明したもの) 別々のグループの平均を比較する。 Excel 「t 検定: 等分散を仮定した 2 標本による検定」 又は 「t 検定: 分散が等しくないと仮定した 2 標本による検定」 対応のある場合 同じ人が、 ・時間の経過で変化 ・何か特別なことをした前後(特別なことが有効だったかの判断) Excel 「t 検定: 一対の標本による平均の検定」

来年度の課題研究のデータの分析に向けて(2) グループ間の人数などの違いを比較する 表: 男女別の好みの違いの人数 カイ二乗検定使います。

来年度の課題研究のデータの分析に向けて(3) 3個以上のグループ間の平均などを判断する t検定は2グループの比較、それ以上のグループの比較は分散分析使います。