第4章 統計的検定 統計学 2015年度.

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

第4章 統計的検定 統計学 2015年度

Ⅰ 仮説検定の考え方 Ⅱ 1つの標本にもとづく検定 Ⅲ 2つの標本にもとづく検定 a) 仮説の設定 b) 2種類の誤り c) 仮説検定の手順 Ⅰ 仮説検定の考え方 a) 仮説の設定 1) 検定仮説、対立仮説 2) 片側検定、両側検定 b) 2種類の誤り c) 仮説検定の手順 Ⅱ 1つの標本にもとづく検定 a) 母平均の検定 1) 母分散が既知の場合 2) 母分散が未知の場合 b) 母比率の検定 Ⅲ 2つの標本にもとづく検定 a) 母平均の差の検定 1) 母分散がともに分かっている場合 2) 母分散は分からないが、等しいとみなしてよい場合 ※ 等分散の検定 3) 母分散について全く分からない場合 b) 母比率の差の検定

Ⅰ 仮説検定の考え方 次のような問題を考える。 2014年のセンター試験、英語の平均点は119点であった。 Ⅰ 仮説検定の考え方 次のような問題を考える。 2014年のセンター試験、英語の平均点は119点であった。 T高校では3年生全員がセンター試験を受験したが、受験生の中から25人を選んで調査したところ、その平均点は130点であった。 T高校の生徒の英語の試験の成績は、全受験者平均より良いといえるだろうか。  ⇒ この疑問に対し、統計的に答える方法が統計的検定 母集団(T高校3年生全員) × 標本(n=25) × × × × × × × × × 標本平均x=130 母平均μ 検定(119点より良いかどうか)

a) 仮説の設定 1) 検定仮説、対立仮説 この問題において、「T高校の生徒の英語の成績は全受験者平均と変わらない」のか、 「T高校の生徒の英語の成績は全受験者平均より高い」のかが知りたいことである。 T高校の受験生全体の英語の平均点をμとあらわすと、 H0: μ=119 H1: μ>119   という二者択一の仮説を考え、標本の情報によっていずれか一方の仮説を採択する。

検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。 検定仮説(H0) 検定したい状況を表したもの。否定されることを目的とした仮説の設定をおこなうことがあるので、帰無仮説といわれることもある。(この場合、T高校としては「全受験者平均より良い」という結論を出したいので、この仮説は否定してほしい) 対立仮説(H1) 検定仮説と反対の状況をあらわしたもの。   検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。

⇒ このように、対立仮説のとりうる範囲が検定仮説の片側にくる検定を片側検定という。 2) 片側検定、両側検定 この例では、T高校の受験生の平均点は「変わらない」か「高い」の場合のみを考えた。(T高校の受験生の平均点が全受験者平均より「低い」場合は考えなかった)   ⇒ このように、対立仮説のとりうる範囲が検定仮説の片側にくる検定を片側検定という。 ※ この例の場合、検定仮説をH0: μ≦119として、 「 T高校の生徒の英語の成績は全受験者平均より高くない」のか 「 T高校の生徒の英語の成績は全受験者平均より高い」のかを検定することも可能である。しかしこの場合も検定仮説は対立仮説に近い値であるH0: μ=119を用いる。理由は後述する。 H0: μ=119 H1: μ>119

⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。このような検定を両側検定という。 一方、ネジを作る工場において作られたネジが規格どおりかどうかを判断する場合には、「規格どおり」か「大きいか、小さいか」という判断が必要となる。   ⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。このような検定を両側検定という。  たとえば、ネジの直径が5mmかどうかを検定するには、 H0: μ = 5 H1: μ ≠ 5  という両側検定をおこなうことになる。 H1: μ<5 H0: μ=5 H1: μ>5 あわせてH1: μ≠5

理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さくなるような検定であるが、これらを同時に成り立たせることは難しい。 b) 2種類の誤り 仮説検定には2種類の誤りがある。 理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さくなるような検定であるが、これらを同時に成り立たせることは難しい。 通常は第1種の誤りを0.05などの一定の小さな値(有意水準という)以下におさえた検定をおこなう。これはH0を否定(棄却)する強い証拠がない限り、H0を採択するということである。 H0を採択 (逮捕) H1を採択 (不逮捕) H0が真 (真犯人) H1が真 (無実) 取り逃がし (第1種の誤り) 正 誤逮捕 (第2種の誤り) 正

仮説検定は次のような手順をとる。 c) 仮説検定の手順 <ステップ1> 仮説の設定 <ステップ2> 仮説検定に適当な統計量を選ぶ   仮説検定は次のような手順をとる。 <ステップ1> 仮説の設定 <ステップ2> 仮説検定に適当な統計量を選ぶ 検定仮説の採択域と棄却域を設定する <ステップ3> 統計量が採択域 統計量が棄却域 <ステップ4> H0を採択 H1を採択

<ステップ2>仮説検定に適当な統計量 T高校の例では、25人の標本平均 𝑥 の分布は中心極限定理により、平均μ、分散 𝜎 2 𝑛 の正規分布にしたがう。 これを標準化した 𝑧= 𝑥 −𝜇 𝜎 𝑛  は標準正規分布にしたがうので、これが仮説検定に適当な統計量である。  (母分散が未知の場合は 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 が自由度n-1のt分布にしたがうことを使う)

仮説検定では、まず検定仮説が正しいと思ってみる。T高校の例で、σ=40であったなら、 𝑥 は平均 𝜇=119 、 <ステップ3>採択域と棄却域の設定 仮説検定では、まず検定仮説が正しいと思ってみる。T高校の例で、σ=40であったなら、 𝑥 は平均 𝜇=119 、   標準偏差 𝜎 𝑛 = 40 25 = 40 5 =8 の正規分布にしたがう。   𝑧= 𝑥 −𝜇 𝜎 𝑛 = 130−119 40 25 = 11 8 =1.375となる。これは標本分布の95%の範囲内(両側検定の場合)である。⇒検定仮説を採択 𝑥 の分布 zの分布 標準化  →

もし、z=2.5という結果が出たなら、どのように考えれば良いのであろうか。( 𝑥 =139のとき、z=2.5となる。) この例の場合対立仮説を採択し、他の母集団(たとえばμ=140)から得られた標本と考える。 片側検定の場合は、 zが0よりだいぶ大きい場合、検定仮説を棄却して対立仮説を採択することになるが、このようなzの値は、μ<119を仮定した分布(たとえばμ=115)のすべてにおいて、検定仮説が棄却される。 zがここだったら検定仮説を棄却し、対立仮説を採択する。 zがここだったら検定仮説を棄却し、対立仮説を採択する。

片側検定において有意水準5%の検定をおこなう場合、標準正規分布にしたがう変数であれば、 採択域と棄却域は次のように設定される。 判定の境界値はそれぞれの統計量の分布による。(統計量の分布が標準正規分布で両側検定の場合は、-1.96と1.96の間に入れば採択域、それ以外が棄却域となる) 片側検定において有意水準5%の検定をおこなう場合、標準正規分布にしたがう変数であれば、    𝑧≤1.64 のとき検定仮説を採択し、 𝑧>1.64 のとき対立仮説を採択する。 t分布にしたがう変数であれば、α=.05の列から求める自由度のものを探す。(ここでは、t0.90と表記する。) 両側検定 棄却域 採択域 棄却域 片側検定 採択域 棄却域

Ⅱ 1つの標本にもとづく検定 次のような問題を考える。 Ⅱ 1つの標本にもとづく検定 a) 母平均の検定 1) 母分散が既知の場合 次のような問題を考える。 (例) ある工場では直径5mmのねじを標準偏差0.04mmにおさまるような管理体制で製造している。製造機械の劣化によって、品質に変化が生じたかどうかを検討するために、9本を標本として選んだところ、その平均が4.97mmであった。これは品質管理上異常なしと考えて良いだろうか。

この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」かを検定する。 1.仮説の設定   この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」かを検定する。   検定仮説としては「品質管理上異常がない」という仮説を用いる。このとき対立仮説は「品質管理上異常がある」という仮説となり、 H0: μ=5 vs. H1: μ≠5   と表すことができる。この場合、対立仮説は検定仮説の両側をとる(「異常がある」には、「大きすぎる」と「小さすぎる」の両方が含まれ、「異常がない」という検定仮説の両側の範囲をとる)。   ※1 検定仮説と対立仮説を逆にし、 H0: μ≠5 vs. H1: μ =5 とすることも考えられる。しかし、採択域と棄却域を構成する場合、検定仮説が正しいとみなして構成するため、検定仮説はある範囲(複合仮説)より、1つの数値(単純仮説)であることの方が望ましい。   ※2 「ねじがねじ穴に入るかどうか」を検定するなら、「ねじ穴に入る」という検定仮説と、「ねじ穴に入らない」という対立仮説が考えられる。すなわち、 H0: μ≦5 vs. H1: μ > 5 とすることである。

この例では母分散が分かっているので、標本平均 𝑥 を用いて、 2.検定統計量   この例では母分散が分かっているので、標本平均 𝑥 を用いて、 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域   検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したzが0から大きく離れていたならばこの仮定は誤りだったと考える。 𝑧= 𝑥 −𝜇 𝜎 𝑛 zがここだったら検定仮説が正しいが zがここだったら検定仮説は誤りで、 このような分布が正しいと考える。

この場合、zは標準正規分布にしたがうので、有意水準5%†の仮説検定をおこなうなら、 −1.96≤𝑧≤1.96 のとき検定仮説を採択し、     −1.96≤𝑧≤1.96 のとき検定仮説を採択し、     𝑧<−1.96 または 𝑧>1.96 のとき対立仮説を採択する。 † 検定仮説が正しいなら、z>1.96またはz<-1.96となるような 𝑥 が選ばれる確率は5%である。これは第1種の誤りの確率すなわち有意水準が5%であることを意味している。 4.統計量の計算   検定仮説が正しいとみなして(μに5を入れて)統計量を計算すると   となる。よって 𝑧<−1.96 なので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。 棄却域 -1.96 採択域 1.96 棄却域 𝑧= 𝑥 −𝜇 𝜎 𝑛 = 4.97−5 0.04 9 = −0.03 0.04 3 = −0.09 0.04 =− 9 4 =−2.25

母分散が未知の場合は、zの代わりに 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 を考え、これが自由度n-1のt分布にしたがうことを用いて仮説検定をおこなう。 2) 母分散が未知の場合   母分散が未知の場合は、zの代わりに 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 を考え、これが自由度n-1のt分布にしたがうことを用いて仮説検定をおこなう。 次のような問題を考える。 (例) ある科目の試験を、平均点70点となるように作成したい。そこで、26人をサンプルとして選び、問題をといてもらったところ、26人の平均点は60点、分散が625であった。試験の問題作りは成功したといえるだろうか。

(解) 1.仮説の設定 「平均点が70点である」という仮説を、「平均点が70点でない」という仮説に対して検定するので、 H0: μ=70 vs. H1: μ≠70 という仮説を設定する。 2.検定統計量 標本平均 𝑥 を用いて、 を考えると、これは自由度n-1のt分布にしたがう。 3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考える。tは自由度26-1=25のt分布にしたがうので、t0.95=2.060でる。有意水準5%の仮説検定をおこなうなら、 −2.060≤𝑡≤2.060 のとき検定仮説を採択し、 𝑡<−2.060 または 𝑡>2.060 のとき対立仮説を採択する。 4.統計量の計算   となる。 −2.060≤𝑡≤2.060 なので検定仮説を採択する。よって問題作りは成功したといえる。 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 = 60−70 625 26−1 = −10 25 5 = −10 5 =−2

母比率の検定では、𝑧= 𝑝 −𝑝 𝑝𝑞 𝑛 が標準正規分布にしたがうことを利用する。 b) 母比率の検定 母比率の検定では、𝑧= 𝑝 −𝑝 𝑝𝑞 𝑛 が標準正規分布にしたがうことを利用する。 (例) 2015年6月28日(日)に放送された「FIFA女子ワールドカップ カナダ2015™ 日本×オーストラリア」では、視聴率が12.2%(関東地区 600世帯を対象)であった。この結果から、10%を超えたといえるであろうか。

(解) 1.仮説の設定 H0: p=0.1 vs. H1: p>0.1 という仮説を設定する。「10%を超えない」という検定仮説に対し、「10%を超えた」という対立仮説を検定するので、 H0: p≦0.1 vs. H1: p>0.1 であるが、検定仮説は対立仮説に最も近い1点を考えれば良い。(0.1で成り立てば、それより小さな値では必ず成り立つ) 2.検定統計量 標本比率 𝑝 を用いて、 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説検定を片側検定でおこなうなら、𝑧≤1.64 のとき検定仮説を採択し、 𝑧>1.64 のとき対立仮説を採択する。 4.統計量の計算   となる。 𝑧>1.64 なので検定仮説を棄却する。よってこの番組の視聴率は10%を超えたといえる。 𝑧= 𝑝 −𝑝 𝑝𝑞 𝑛 𝑧= 𝑝 −𝑝 𝑝𝑞 𝑛 = 0.122−0.1 (0.1×0.9) 600 = 0.022 0.0122 =1.803

Ⅲ 2つの標本にもとづく検定 母集団1(個体数N1) 標本1(個体数n1) × × × × × × × × × × Ⅲ 2つの標本にもとづく検定 母集団1(個体数N1) 標本1(個体数n1) × × × × × × × × × × ここに差があるかどうかを検定 この差をもとに 母集団2(個体数N2) 標本2(個体数n2) × × × × × × × × × ×

母平均の差の検定は、母分散についての情報がどの程度あるかによって、次のように分類できる。 a) 母平均の差の検定 2つの母平均の差の検定は、2社のメーカーが作った電球の寿命の差があるかどうかとか、試験の成績について男女間で差があるかどうかなどを検定するときに用いられる。 母平均の差の検定は、母分散についての情報がどの程度あるかによって、次のように分類できる。 1) 母分散がともに分かっている場合 2) 母分散は分からないが、等しいとみなしてよい場合 3) 母分散について全く分からない場合

平均値の差の検定において、2つの標本平均 𝑥 1 − 𝑥 2 の分布は、 1) 母分散がともに分かっている場合  平均値の差の検定において、2つの標本平均 𝑥 1 − 𝑥 2 の分布は、  平均μ1-μ2、分散 𝜎 1 2 𝑛 1 + 𝜎 2 2 𝑛 2 の正規分布にしたがうことが理論的に導かれる。  したがって、  が、標準正規分布にしたがう。  2つの母集団の分散がともに分かっている場合にはこの統計量を用いて、検定をおこなえばよい。  ⇒ ただし、このような仮定はあまり現実的ではない。 𝑧= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 2 𝑛 1 + 𝜎 2 2 𝑛 2

2) 母分散は分からないが、等しいとみなしてよい場合 この場合の検定は、現実味と対処しやすさの両方を持っている。 2) 母分散は分からないが、等しいとみなしてよい場合  この場合の検定は、現実味と対処しやすさの両方を持っている。  母分散を等しいとみなしてよいかどうかは、後述する等分散の検定をおこなうことが可能である。  したがって、   等分散の検定をおこなって等分散であると判定    → 母分散は分からないが等しいとみなしてよい場合の検定の適用  という手順を用いればよい。 母分散は分からないが、等しいとみなしてよい場合には、2つの標本から求められた分散を 𝑠 1 2 , 𝑠 2 2 とあらわすと、母分散の不偏推定量は   となり、これを用いて   を考えると、これは自由度 n1+ n2-2 のt分布にしたがう。 𝜎 2 = 𝑛 1 𝑠 1 2 + 𝑛 2 𝑠 2 2 𝑛 1 + 𝑛 2 −2 𝑡= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 𝑛 1 + 1 𝑛 2

(例) A, B 2銘柄のタバコのニコチン含有量を調べたところ、銘柄Aのタバコ10本は平均 27. 0mg、標準偏差 1 (例) A, B 2銘柄のタバコのニコチン含有量を調べたところ、銘柄Aのタバコ10本は平均 27.0mg、標準偏差 1.7mg、 銘柄Bのタバコ7本は平均 29.3mg、標準偏差 1.9mgであった。この2つの銘柄の間にニコチン含有量の差はあるであろうか。 (解) 1.仮説の設定 銘柄Aのニコチン含有量をμ1、銘柄Bのニコチン含有量をμ2とし、M=μ1 ー μ2とすると、 H0: M=0 vs. H1: M≠0 となる。 2.検定統計量 標本平均 𝑥 1 , 𝑥 2 を用いて、 を考えると、これは自由度n1+n2-2のt分布にしたがう。 𝑡= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 𝑛 1 + 1 𝑛 2

よって 𝑡<−2.131 なので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。 2銘柄のニコチン含有量には差があるといえる。 3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考える。tは自由度10+7-2=15のt分布にしたがうので、t0.95=2.131である。有意水準5%の仮説検定をおこなうなら、−2.131≤𝑡≤2.131 のとき検定仮説を採択し、 𝑡<−2.131 または 𝑡>2.131 のとき対立仮説を採択する。 4.統計量の計算 σ2について不偏推定量   を用いると、   よって 𝑡<−2.131 なので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。   2銘柄のニコチン含有量には差があるといえる。 𝜎 2 = 𝑛 1 𝑠 1 2 + 𝑛 2 𝑠 2 2 𝑛 1 + 𝑛 2 −2 = 10× 1.7 2 +7× 1.9 2 10+7−2 = 54.17 15 =3.611 𝑡= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 𝑛 1 + 1 𝑛 2 = 27.0−29.3 −0 3.611× 1 10 + 1 7 = −2.3 0.936 =−2.457

※ 等分散の検定 2つの母集団の分散が等しいかどうかについても検定をおこなうことができる。この検定では、「2つの母集団の分散は等しい」という検定仮説に対し、「 2つの母集団の分散は等しくない」という対立仮説を想定して検定をおこなう。すなわち、 H0: σ1 = σ2 vs. H1: σ1≠σ2   という仮説検定である。   この場合、 𝐹= 𝑛 1 𝑛 1 −1 𝑠 1 2 𝑛 2 𝑛 2 −1 𝑠 2 2   が自由度(n1-1, n2-1) のF分布に従う

F分布は次のような形状をしている。

<例> タバコの2銘柄の間で、ニコチン含有量の母分散に差があるかどうかを検定してみる。 <例> タバコの2銘柄の間で、ニコチン含有量の母分散に差があるかどうかを検定してみる。 銘柄Aは10本で標準偏差 1.7mg、 銘柄Bは7本で標準偏差 1.9mg であった。 H0: σ1 = σ2 vs. H1: σ1≠σ2   という仮説検定をおこなうとき、検定統計量は   となり、これが自由度(n1-1, n2-1) のF分布に従う。   自由度(9,6)のF分布の95%点は(0.231, 5.523)となるので、     0.231≦F≦5.523のとき、検定仮説を採択し、     F<0.231またはF>5.523のとき、検定仮説を棄却し、対立仮説を採択する。 𝐹= 𝑛 1 𝑛 1 −1 𝑠 1 2 𝑛 2 𝑛 2 −1 𝑠 2 2

  検定統計量を計算すると 𝐹= 𝑛 1 𝑛 1 −1 𝑠 1 2 𝑛 2 𝑛 2 −1 𝑠 2 2 = 10 10−1 × 1.7 2 7 7−1 × 1.9 2 = 3.211 4.212 =0.762   となるので、0.231≦F≦5.523より検定仮説を採択する。   よって、2つの母集団の分散は等しいといえる。(より正確には2つの母集団の分散が異なるとはいえない)   この検定をおこなえば、母分散の等しい場合の検定を用いることができることがわかる。   † 平均値の差の検定の予備的分析としてこの検定を用いる場合、有意水準を少し大きめにとる(たとえば0.25など)。有意水準が0.05であると、母集団の分散が等しいという検定仮説が棄却されにくく、母分散が異なる場合にも、母分散が等しいと仮定して平均値の差の検定をおこなってしまうからである。

3) 母分散について全く分からない場合  この場合には、 𝑡= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 𝑛 1 + 1 𝑛 2  が自由度 n1+ n2-2 のt分布には従わないことがわかっている。  しかし、自由度を修正することによって、t検定を利用することができる。  自由度を 𝜈= 𝑠 1 2 𝑛 1 −1 + 𝑠 2 2 𝑛 2 −1 2 𝑠 1 2 𝑛 1 −1 2 𝑛 1 −1 + 𝑠 2 2 𝑛 2 −1 2 𝑛 2 −1  によって求めると、自由度𝜈のt分布に従う。(Welchの方法)

2つの母比率p1およびp2に差があるかどうかを検定する場合は、 b) 母比率の差の検定 2つの母比率p1およびp2に差があるかどうかを検定する場合は、 𝑧= 𝑝 1 − 𝑝 2 − 𝑝 1 − 𝑝 2 𝑝𝑞 1 𝑛 1 + 1 𝑛 2   が標準正規分布にしたがうことを利用する。 (例) 6月21日(日)に放送された「真相報道バンキシャ!」の視聴率は13.8%(関東地区 600世帯を対象)であった。この結果は、同じ6月21日(日)に放送されたアニメ「サザエさん」の視聴率12.2%を上回ったといえるかどうか。

を考えると、これは標準正規分布にしたがう。 (解) 1.仮説の設定 「真相報道バンキシャ!」の視聴率をp1、 「サザエさん」の視聴率をp2とし、M= p1-p2とすると、H0: M=0 vs. H1: M>0 となる。 2.検定統計量 標本比率 𝑝 1 , 𝑝 2 を用いて、 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説検定をおこなうなら、𝑧≤1.64 のとき検定仮説を採択し、 𝑧>1.64 のとき対立仮説を採択する。 4.統計量の計算 pの値が不明なので、プールした推定値 0.138+0.122 2 =0.13 をもちいる。   より、𝑧≤1.64 なので検定仮説を棄却する。 「真相報道バンキシャ!」 の視聴率は「サザエさん」の視聴率を上回ったとはいえない。 𝑧= 𝑝 1 − 𝑝 2 − 𝑝 1 − 𝑝 2 𝑝𝑞 1 𝑛 1 + 1 𝑛 2 𝑧= 𝑝 1 − 𝑝 2 − 𝑝 1 − 𝑝 2 𝑝𝑞 1 𝑛 1 + 1 𝑛 2 = 0.138−0.122 −0 0.13×0.87× 1 600 + 1 600 = 0.016 0.0194 =0.825