第4章統計的検定統計学　2012年度.

Slides:

Advertisements

Similar presentations

ゲームプログラミング講習第2章関数の使い方

Advertisements

サービス管理責任者等研修テキスト分野別講義　　　「アセスメントと　　　　　　　支援提供の基本姿勢」＜児童発達支援管理責任者＞平成２７年１０月１日.

ヒトの思考プロセスの解明を目的とするワーキングメモリの研究

第２７講オームの法則電気抵抗の役割について知るオームの法則を使えるようにする抵抗の温度変化を理解する教科書Ｐ．223～226

コラッツ予想の変形について東邦大学　理学部　情報科白柳研究室山中　陽子.

コンパイラ第3回字句解析 ― 決定性有限オートマトンの導出 ―

第5章家計に関する統計ｰ経済統計ｰ.

公共財公共経済論 II no.3 麻生良文.

VTX alignment D2 浅野秀光２０１１年１２月１５日　放射線研ミーティング.

冷却フランシウム原子を用いた電子の永久電気双極子能率探索のためのルビジウム磁力計の研究

生命情報学（８）スケールフリーネットワーク

前半戦「史上最強」風札上げクイズ.

認知症を理解し環境の重要性について考える

フッ化ナトリウムによる洗口２０１０・９・１３宮崎市郡東諸県郡薬剤師会学校薬剤師　　日高　華代子.

食品の安全性に関わる社会システム：総括健康弱者ハイリスク集団 HACCP （食肉処理場・食品工場）農場でのQAP 一般的衛生管理

規制改革とは？ ○規制改革の目的は、経済の活性化と雇用の創出によって、　活力ある経済社会の実現を図ることにあります。

地域保健対策検討会に関する私見（保健所のあり方）

公共政策大学院鈴木一人第8回　専門化する政治公共政策大学院鈴木一人

医薬品ネット販売規制について 2012年５月31日ケンコーコム株式会社.

平成２６年８月２７日（水）大阪府健康医療部薬務課医療機器グループ

平成26年度呼吸器学会からの提案結果（オレンジ色の部分が承認された提案）新規提案既収載の変更免疫組織化学染色、免疫細胞化学染色

エナジードリンクの危険性 2015年6月23日経営学部市場戦略学科MR３１９５稲沢珠依.

自動吸引は在宅を変えるか大分協和病院　院長　　　　　　　　山本　真.

毎月レポートビジネスの情報（2016年7月号）.

医療の歴史と将来医療と医薬品産業個人的経験 3. 「これからの医療を考える」（1）医薬品の研究開発－タクロリムスの歴史－

社会福祉調査論第4講２.社会調査の概要 11月２日.

2015年12月28日－2016年3月28日掲載分.

2010度民事訴訟法講義補論関西大学法学部教授栗田　隆.

腫瘍学概論埼玉医科大学国際医療センター包括的がんセンター緩和医療科/緩和ケアチーム奈良林至

“企業リスクへの考え方に変化を求められています。トータルなリスクマネジメント・サービスをプロデュースします。“

情報漏えい経済情報学科 E 　西村　諭 E 　釣　洋平.

金融班（ミクロ）.

第11回 2009年12月16日今日の資料＝A4・4枚＋解答用紙期末試験：2月3日（水）N2教室

【ＡＢＬ用語集】（あいうえお順） No 用語解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17

基礎理論(3) 情報の非対称性と逆選択公共政策論II No.3 麻生良文.

浜中健児昭和４２年３月２７日生まれ東京都在住株式会社ピー･アール･エフ代表取締役（学歴) 高校：千葉県立東葛飾高校卒業

COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED

Blosxom による CMS 構築と SEO テクニック

記入例 JAWS DAYS 2015 – JOB BOARD 会社名採用職種営業職／技術職／その他（）仕事内容待遇募集数

ネットビジネスの企業と特性 MR1127　まさ.

Future Technology活用による業務改革

ネットビジネス論（杉浦）第８回　ネットビジネスと情報技術.

g７４１００１長谷川嵩 g７４０７９６迫村光秋 g７４１０００西田健太郎 g７４１１４７小井出真聡

自然独占公共経済論 II no.5 麻生良文.

Autonomic Resource Provisioning for Cloud-Based Software

Webショップにおける webデザイン 12/6　08A1022 甲斐　広大.

物理的な位置情報を活用した仮想クラウドの構築

ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み

寺尾敦青山学院大学社会情報学部第12回　情報デザイン（４）情報の構造化と表現寺尾　敦青山学院大学社会情報学部

【１−１．開発計画 – 設計・開発計画】システム開発計画にはシステム開発を効率的、効果的に実行する根拠（人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等）を記述すること。システム開発の開始から終了までの全体スケジュールを記載すること。アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。

6　日本のコーポレート・ガバナンス 2008年度「企業論」川端　望.

急成長する中国ソフトウェア産業中国ソフトウェアと情報サービス産業の規模総売上高は5年間で約5.3倍の成長

米国ユタ州ＬＤＳ病院胸部心臓外科フェローの経験

公益社団法人日本青年会議所関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会

次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会明治大学駿河台校舎リバティタワー9階1096教室

子どもの本の情報大阪府内の協力書店の情報こちらをクリック大阪府内の公立図書館・図書室の情報

第2回産業調査小島浩道.

〈起点〉を示す格助詞「を」と「から」の選択について

広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について　　－日本語教育と中日カルチャーショックの観点から－名古屋大学杉村　泰.

■5Ahバッテリー使用報告事例紹介/東【その1】 ■iphon4S（晴れの昼間/AM8-PM3） ◆約1時間で68%⇒100％

『ワタシが!!』『地域の仲間で!!』市民が始める自然エネルギー!!

ポイントカードの未来形を形にした「MUJI Passport」

SAP NetWeaver を支える Microsoft テクノロジーの全貌（Appendix）

ガイダンス（内業）測量学実習　第1回.

Python超入門久保幹雄東京海洋大学.

熱力学の基礎丸山茂夫東京大学大学院工学系研究科機械工学専攻

京都民医連中央病院 CHDF学習推進委員会

資料２－④ ④下水道.

ＡｃｃｅｓｓによるＳＱＬの操作～実際にテーブルを操作してみよう！～.

Presentation transcript:

第4章統計的検定統計学　2012年度

Ⅰ 仮説検定の考え方 Ⅱ 1つの標本にもとづく検定 Ⅲ 2つの標本にもとづく検定 a) 仮説の設定 b) 2種類の誤り c) 仮説検定の手順 Ⅰ　仮説検定の考え方 a)　仮説の設定 1)　検定仮説、対立仮説 2)　片側検定、両側検定 b)　2種類の誤り c)　仮説検定の手順 Ⅱ　1つの標本にもとづく検定 a)　母平均の検定 1)　母分散が既知の場合 2)　母分散が未知の場合 b)　母比率の検定 Ⅲ　2つの標本にもとづく検定 a)　母平均の差の検定 1)　母分散がともに分かっている場合 2)　母分散は分からないが、等しいとみなしてよい場合 ※　等分散の検定 3)　母分散について全く分からない場合 b)　母比率の差の検定

Ⅰ 仮説検定の考え方次のような問題を考える。 2012年のセンター試験、英語の平均点は124点であった。 Ⅰ　仮説検定の考え方次のような問題を考える。 2012年のセンター試験、英語の平均点は124点であった。 T高校では3年生全員がセンター試験を受験したが、受験生の中から25人を選んで調査したところ、その平均点は135点であった。 T高校の生徒の英語の試験の成績は、全受験者平均より良いといえるだろうか。　⇒　この疑問に対し、統計的に答える方法が統計的検定母集団（T高校3年生全員） × 標本（n=25） × × × × × × × × × 標本平均x=135 母平均μ 検定(124点より良いかどうか)

a)　仮説の設定 1)　検定仮説、対立仮説この問題において、「T高校の生徒の英語の成績は全受験者平均と変わらない」のか、「T高校の生徒の英語の成績は全受験者平均より高い」のかが知りたいことである。 T高校の受験生全体の英語の平均点をμとあらわすと、 H0:　μ=124 H1:　μ>124 　　という二者択一の仮説を考え、標本の情報によっていずれか一方の仮説を採択する。

検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。検定仮説（H0）　検定したい状況を表したもの。否定されることを目的とした仮説の設定をおこなうことがあるので、帰無仮説といわれることもある。（この場合、T高校としては「全受験者平均より良い」という結論を出したいので、この仮説は否定してほしい）対立仮説（H1）　検定仮説と反対の状況をあらわしたもの。　検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。

⇒ このように、対立仮説のとりうる範囲が検定仮説の片側にくる検定を片側検定という。 2)　片側検定、両側検定この例では、T高校の受験生の平均点は「変わらない」か「高い」の場合のみを考えた。（T高校の受験生の平均点が全受験者平均より「低い」場合は考えなかった）　　⇒　このように、対立仮説のとりうる範囲が検定仮説の片側にくる検定を片側検定という。 ※　この例の場合、検定仮説をH0: μ≦124として、「 T高校の生徒の英語の成績は全受験者平均より高くない」のか「 T高校の生徒の英語の成績は全受験者平均より高い」のかを検定することも可能である。しかしこの場合も検定仮説は対立仮説に近い値であるH0: μ=124を用いる。理由は後述する。 H0: μ=124 H1: μ>124

⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。このような検定を両側検定という。一方、ネジを作る工場において作られたネジが規格どおりかどうかを判断する場合には、「規格どおり」か「大きいか、小さいか」という判断が必要となる。　　⇒　この場合、対立仮説は検定仮説の両側の範囲をとる。このような検定を両側検定という。　たとえば、ネジの直径が5mmかどうかを検定するには、 H0: μ = 5 H1: μ ≠ 5 　という両側検定をおこなうことになる。 H1: μ<5 H0: μ=5 H1: μ>5 あわせてH1: μ≠5

理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さくなるような検定であるが、これらを同時に成り立たせることは難しい。 b)　2種類の誤り仮説検定には2種類の誤りがある。理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さくなるような検定であるが、これらを同時に成り立たせることは難しい。通常は第1種の誤りを0.05などの一定の小さな値（有意水準という）以下におさえた検定をおこなう。これはH0を否定(棄却)する強い証拠がない限り、H0を採択するということである。 H0を採択 (逮捕) H1を採択 (不逮捕) H0が真（真犯人） H1が真（無実）取り逃がし（第1種の誤り）正誤逮捕（第2種の誤り）正

仮説検定は次のような手順をとる。 c) 仮説検定の手順＜ステップ１＞仮説の設定＜ステップ２＞仮説検定に適当な統計量を選ぶ　　仮説検定は次のような手順をとる。＜ステップ１＞仮説の設定＜ステップ２＞仮説検定に適当な統計量を選ぶ検定仮説の採択域と棄却域を設定する＜ステップ３＞統計量が採択域統計量が棄却域＜ステップ４＞ H0を採択 H1を採択

𝑥 の分布 zの分布標準化　→

zがここだったら検定仮説を棄却し、対立仮説を採択する。 zがここだったら検定仮説を棄却し、対立仮説を採択する。

片側検定において有意水準5%の検定をおこなう場合、標準正規分布にしたがう変数であれば、採択域と棄却域は次のように設定される。判定の境界値はそれぞれの統計量の分布による。（統計量の分布が標準正規分布で両側検定の場合は、-1.96と1.96の間に入れば採択域、それ以外が棄却域となる）片側検定において有意水準5%の検定をおこなう場合、標準正規分布にしたがう変数であれば、　　 𝑧≤1.64 のとき検定仮説を採択し、 𝑧>1.64 のとき対立仮説を採択する。 t分布にしたがう変数であれば、α=.05の列から求める自由度のものを探す。(ここでは、t0.90と表記する。) 両側検定棄却域採択域棄却域片側検定採択域棄却域

Ⅱ 1つの標本にもとづく検定次のような問題を考える。 Ⅱ　1つの標本にもとづく検定 a)　母平均の検定 1)　母分散が既知の場合次のような問題を考える。（例）　ある工場では直径5mmのねじを標準偏差0.04mmにおさまるような管理体制で製造している。製造機械の劣化によって、品質に変化が生じたかどうかを検討するために、9本を標本として選んだところ、その平均が4.97mmであった。これは品質管理上異常なしと考えて良いだろうか。

この例の場合、「品質管理上異常がない」か、「品質管理上異常がある」かを検定する。１．仮説の設定　　この例の場合、「品質管理上異常がない」か、「品質管理上異常がある」かを検定する。　　検定仮説としては「品質管理上異常がない」という仮説を用いる。このとき対立仮説は「品質管理上異常がある」という仮説となり、 H0: μ=5 vs. H1: μ≠5 　　と表すことができる。この場合、対立仮説は検定仮説の両側をとる（「異常がある」には、「大きすぎる」と「小さすぎる」の両方が含まれ、「異常がない」という検定仮説の両側の範囲をとる）。　　※１　検定仮説と対立仮説を逆にし、 H0: μ≠5 vs. H1: μ =5 とすることも考えられる。しかし、採択域と棄却域を構成する場合、検定仮説が正しいとみなして構成するため、検定仮説はある範囲(複合仮説)より、1つの数値(単純仮説)であることの方が望ましい。　　※2　「ねじがねじ穴に入るかどうか」を検定するなら、「ねじ穴に入る」という検定仮説と、「ねじ穴に入らない」という対立仮説が考えられる。すなわち、 H0: μ≦5 vs. H1: μ > 5 とすることである。

この例では母分散が分かっているので、標本平均 𝑥 を用いて、２．検定統計量　　この例では母分散が分かっているので、標本平均 𝑥 を用いて、を考えると、これは標準正規分布にしたがう。３．採択域と棄却域　　検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したzが0から大きく離れていたならばこの仮定は誤りだったと考える。 𝑧= 𝑥 −𝜇 𝜎 𝑛 zがここだったら検定仮説が正しいが zがここだったら検定仮説は誤りで、このような分布が正しいと考える。

棄却域 -1.96 採択域 1.96 棄却域 𝑧= 𝑥 −𝜇 𝜎 𝑛 = 4.97−5 0.04 9 = −0.03 0.04 3 = −0.09 0.04 =− 9 4 =−2.25

母分散が未知の場合は、zの代わりに 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 を考え、これが自由度n-1のt分布にしたがうことを用いて仮説検定をおこなう。 2)　母分散が未知の場合　　母分散が未知の場合は、zの代わりに 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 を考え、これが自由度n-1のt分布にしたがうことを用いて仮説検定をおこなう。次のような問題を考える。（例）　ある科目の試験を、平均点70点となるように作成したい。そこで、26人をサンプルとして選び、問題をといてもらったところ、26人の平均点は60点、分散が625であった。試験の問題作りは成功したといえるだろうか。

（解）１．仮説の設定「平均点が70点である」という仮説を、「平均点が70点でない」という仮説に対して検定するので、 H0: μ=70 vs. H1: μ≠70 という仮説を設定する。２．検定統計量標本平均 𝑥 を用いて、を考えると、これは自由度n-1のt分布にしたがう。３．採択域と棄却域　検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考える。tは自由度26-1=25のt分布にしたがうので、t0.95=2.060でる。有意水準5%の仮説検定をおこなうなら、 −2.060≤𝑡≤2.060 のとき検定仮説を採択し、 𝑡<−2.060 または 𝑡>2.060 のとき対立仮説を採択する。４．統計量の計算　　となる。 −2.060≤𝑡≤2.060 なので検定仮説を採択する。よって問題作りは成功したといえる。 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 𝑡= 𝑥 −𝜇 𝑠 𝑛−1 = 60−70 625 26−1 = −10 25 5 = −10 5 =−2

母比率の検定では、𝑧= 𝑝 −𝑝 𝑝𝑞 𝑛 が標準正規分布にしたがうことを利用する。 b)　母比率の検定母比率の検定では、𝑧= 𝑝 −𝑝 𝑝𝑞 𝑛 が標準正規分布にしたがうことを利用する。（例）　2012年6月12日(火)に放送された「2014FIFAワールドカップ™アジア地区最終予選オーストラリア×日本」では、視聴率が35.1%(関東地区 600世帯を対象)であった。この結果から、30%を超えたといえるであろうか。

（解）１．仮説の設定 H0: p=0.3 vs. H1: p＞0.3 という仮説を設定する。「30%を超えない」という検定仮説に対し、「30%を超えた」という対立仮説を検定するので、 H0: p≦0.3 vs. H1: p＞0.3 であるが、検定仮説は対立仮説に最も近い1点を考えれば良い。(0.3で成り立てば、それより小さな値では必ず成り立つ) ２．検定統計量標本比率 𝑝 を用いて、を考えると、これは標準正規分布にしたがう。３．採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説検定を片側検定でおこなうなら、𝑧≤1.64 のとき検定仮説を採択し、 𝑧>1.64 のとき対立仮説を採択する。４．統計量の計算　　となる。 𝑧>1.64 なので検定仮説を棄却し、対立仮説を採択する。よってこの番組の視聴率は20%を超えたといえる。 𝑧= 𝑝 −𝑝 𝑝𝑞 𝑛 𝑧= 𝑝 −𝑝 𝑝𝑞 𝑛 = 0.351−0.3 (0.3×0.7) 600 = 0.051 0.0187 =2.727

Ⅲ 2つの標本にもとづく検定母集団1（個体数N1）標本1（個体数n1） × × × × × × × × × × Ⅲ　2つの標本にもとづく検定母集団1（個体数N1）標本1（個体数n1） × × × × × × × × × × ここに差があるかどうかを検定この差をもとに母集団2（個体数N2）標本2（個体数n2） × × × × × × × × × ×

母平均の差の検定は、母分散についての情報がどの程度あるかによって、次のように分類できる。 a)　母平均の差の検定 2つの母平均の差の検定は、2社のメーカーが作った電球の寿命の差があるかどうかとか、試験の成績について男女間で差があるかどうかなどを検定するときに用いられる。母平均の差の検定は、母分散についての情報がどの程度あるかによって、次のように分類できる。 1) 母分散がともに分かっている場合 2) 母分散は分からないが、等しいとみなしてよい場合 3) 母分散について全く分からない場合

𝑧= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 2 𝑛 1 + 𝜎 2 2 𝑛 2

𝜎 2 = 𝑛 1 𝑠 1 2 + 𝑛 2 𝑠 2 2 𝑛 1 + 𝑛 2 −2 𝑡= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 𝑛 1 + 1 𝑛 2

𝑡= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 𝑛 1 + 1 𝑛 2

𝜎 2 = 𝑛 1 𝑠 1 2 + 𝑛 2 𝑠 2 2 𝑛 1 + 𝑛 2 −2 = 10× 1.7 2 +7× 1.9 2 10+7−2 = 54.17 15 =3.611 𝑡= 𝑥 1 − 𝑥 2 − 𝜇 1 − 𝜇 2 𝜎 1 𝑛 1 + 1 𝑛 2 = 27.0−29.3 −0 3.611× 1 10 + 1 7 = −2.3 0.936 =−2.457

F分布は次のような形状をしている。

＜例＞タバコの2銘柄の間で、ニコチン含有量の母分散に差があるかどうかを検定してみる。＜例＞　タバコの2銘柄の間で、ニコチン含有量の母分散に差があるかどうかを検定してみる。銘柄Aは10本で標準偏差 1.7mg、銘柄Bは7本で標準偏差 1.9mg であった。 H0：　σ1 = σ2　vs.　H1:　σ1≠σ2 　　という仮説検定をおこなうとき、検定統計量は　　となり、これが自由度(n1-1, n2-1) のF分布に従う。　　自由度(9,6)のF分布の95%点は（0.231, 5.523）となるので、　　　　0.231≦F≦5.523のとき、検定仮説を採択し、　　　　F＜0.231またはF＞5.523のとき、検定仮説を棄却し、対立仮説を採択する。 𝐹= 𝑛 1 𝑛 1 −1 𝑠 1 2 𝑛 2 𝑛 2 −1 𝑠 2 2

𝑧= 𝑝 1 − 𝑝 2 − 𝑝 1 − 𝑝 2 𝑝𝑞 1 𝑛 1 + 1 𝑛 2 𝑧= 𝑝 1 − 𝑝 2 − 𝑝 1 − 𝑝 2 𝑝𝑞 1 𝑛 1 + 1 𝑛 2 = 0.182−0.152 −0 0.167×0.833× 1 600 + 1 600 = 0.03 0.022 =1.364