統計学 講義資料 図表など、テキストに載っている内容は基本的に資料に掲載しません 復習に力をいれること

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

統計学 講義資料 図表など、テキストに載っている内容は基本的に資料に掲載しません 復習に力をいれること  講義資料 図表など、テキストに載っている内容は基本的に資料に掲載しません  復習に力をいれること (練習問題を解いたり、テキストを読みなおす)  成績評価は,期末テストと平常点(小テスト)  質問はオフィスアワー  教科書:『コア・テキスト 統計学 第2版』新世社  参考書:『基本演習 統計学』新世社

内容 準備,データの整理(第1章) 測る(第2章:記述統計量) 確率(第3章:確率とは? 確率変数とは?) 離散確率変数とその分布(第4章) 確率(第3章:確率とは? 確率変数とは?) 離散確率変数とその分布(第4章) 連続確率変数とその分布(第5章) 標本調査・標本分布(第6章:比率・割合の調査、標本分布) 推定(第7章:点推定、区間推定、標本サイズの決定) 仮説検定(第8章:仮説検定とは? 平均値の差の検定など) 回帰分析(第9章) 最尤推定法と統計モデル(第10章)

法曹界でも統計学は使われている 統計用語が使用された判旨の数(調査対象:米高裁,控訴裁,地裁,請求裁) 『法廷のための統計リテラシー』130頁 表4.6, 近代科学社 統計用語 件数 1982年 件数 2010年 Type I, Type II Error 3 17 散布図 5 50 有意水準 10 1549 分散分析 78 サンプルサーベイ 14 120 最小二乗法 16 81 相関係数 19 159 仮説検定(テスト,帰無,棄却) 32 325 カイ二乗 40 133 回帰分析 46 1131 自由度 47 589 サンプルサイズ 94 1449 統計的推計,統計的有意性 151 1519 中央値 688 17007

統計学で何を学ぶのか? 記述統計 標本調査 仮説検定 分析対象の状態をデータによって記述する方法 一部を調べて全体像を探る方法 検証しようとしている仮説 (例:昇給と業績に関連がある)をデータによって検証する方法

標本調査 (一部を調べて全体を知る) 全数調査 すべての対象を調査 標本調査 対象の一部を取り出し調査 全数調査の例: 国勢調査 標本調査  (一部を調べて全体を知る) 全数調査 標本調査 すべての対象を調査 対象の一部を取り出し調査 全数調査の例: 国勢調査 日本国内に常住する全ての人口を対象として5年毎(前回は2015年) 標本調査の例: 視聴率調査 誰を選ぶ? 何人に聞けば?

東京都知事選挙:2016年夏 開票率 2.85%で当確 すべての票を見ていないのに何故わかる? この速報はどの程度,信頼して良いのか? 朝日新聞DIGITAL より すべての票を見ていないのに何故わかる? この速報はどの程度,信頼して良いのか?

米国大統領選挙:2017年秋 http://www.nytimes.com/elections/forecast/president 米国の新聞社は、単に「当確」を示すのではなく、統計学を活用して勝つ確率を提示 Our best guess right now is that Hillary Clinton is on track to win. Our best guess right now is that Donald Trump is on track to win. 2時間後

データの整理 「第1章 1.1, 1.2」 分布とは何か? なぜそんなものが必要か? 度数分布・ヒストグラム 位置に関する代表値 統計基礎 2017/04/11 データの整理 「第1章 1.1, 1.2」 分布とは何か? なぜそんなものが必要か? 度数分布・ヒストグラム 位置に関する代表値 ちらばりに関する代表値 度数分布表からの平均・分散 その他の統計量 データの標準化 分布の形状についての代表値

表1.1 (page 3): 1週間後の為替レートの予想 データをながめるだけではわからないこと 表1.1 (page 3): 1週間後の為替レートの予想 みんなの予想は? 自分の予想はみんなと比べて円高より? データを整理する (度数分布表) 分布とは? 定義1.1(4ページ)分布とは? 視覚的にとらえる(ヒストグラム) 図1.1 階級幅を広くすると,その階級の度数が増える可能性がある 階級幅の違いをどのように調整すればよいか? データを眺めるだけでは気づかないことがみえる

データ全体の特性を表現する数値 データの位置を表す尺度 平均値(mean), 中央値(median), 最頻値(mode) 広がりを表す尺度 分散(variance), 標準偏差(standard deviation) 貯蓄残高の分布: 図1.2 (page 7) 勤労者世帯の貯蓄残高を代表する数値は? 12ページ参照 最頻値が適切(なぜ?) 平均では実感にあわない。どんな状況? 例題1.1 (page 7)

1.2 代表値(データの特性を表す数値) データの位置を表す尺度 平均値(mean), 中央値(median), 最頻値(mode) 広がりを表す尺度 分散(variance), 標準偏差(standard deviation) 分布の形状をみる尺度 歪度(skewness) 分布の対称性 尖度(kurtosis)  分布の広がり・裾の厚さ 度数分布表からの平均・分散(15頁)

50+10×𝑧𝑖 その他の代表値 例題 1.2 : ちらばりを比べる 定義 1.7:変動係数 CV ( Coefficient of Variation ) 定義 1.8:データのちらばりに関する代表値 幾何平均 標準化(基準化) 標準化したものを感覚的にわかりやすいように、さらに変換した例 偏差値 50+10×𝑧𝑖 平均を50に、標準偏差を10にする変換 𝑧 1 , …, 𝑧 𝑛 の平均と分散を計算しなさい 𝑤𝑖 = 50 + 10 × 𝑧𝑖 として,wi の平均と標準偏差をもとめよ 練習問題 データの分布の形状についての代表値

1.1と1.2のまとめ 分布とは何か?  度数分布・ヒストグラム 位置に関する代表値 ちらばりに関する代表値 度数分布表からの平均・分散 その他の統計量 データの標準化 分布の形状についての代表値

1.3 母集団と標本 標本調査の例 視聴率調査では 関東地区1800万程度の各世帯すべてを調査せずに,600世帯程度だけをしらべて,関東地区の視聴率としている 政権支持率の調査では ランダムに選ばれた電話番号に電話をして1000世帯ほどの回答が得られるまで続ける。 他には? このような選び方で、正しく調査できているのだろうか?

どのように標本を選び出せばよいか? 標本として選び出されたデータの数を標本サイズ,あるいは標本の大きさという 標本を選び出すことを標本抽出という 抽出法:有意抽出法と無作為抽出(ランダムサンプリング)法がある 目的は母集団の分布を反映するような標本を選ぶこと 前者は恣意的,後者は恣意性を排除したもの 無作為抽出法には,系統的サンプリング,多段抽出法,層化抽出法などがある(page 25 を読んでおくこと)

母集団 ⋮ 母集団の代表値を推測する (図1.9) 母集団 サンプリング (図1.8) 母集団のすべてを調べないと,その平均や分散はわからない 標本を使って平均や分散をもとめることはできる 「母集団の平均=標本の平均」ならよいのだが。実際は? 母集団 標本 ⋮ 母集団 ・平均 ・分散 ⋮ 標本 母集団の代表値を推測する (図1.9) 母集団の平均や分散を 標本を使って推定する

𝑥 = 1 𝑁 𝑖=1 𝑁 𝑥 𝑖 𝑣= 1 𝑁 𝑖=1 𝑁 𝑥 𝑖 − 𝑥 2 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 母集団のすべてのデータが利用できる場合 平均 (1.1) 分散 (1.2) 𝑥 = 1 𝑁 𝑖=1 𝑁 𝑥 𝑖 𝑣= 1 𝑁 𝑖=1 𝑁 𝑥 𝑖 − 𝑥 2 総数を 𝑁 としている 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 𝑠 2 = 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 − 𝑥 2 標本(母集団の一部)が利用できる場合(標本サイズ 𝑛 ) 平均 (1.1) 分散 (1.3) 𝑛<𝑁 に注意

1.3の理解度の確認:以下の各項目を簡単な言葉で説明できますか? 母集団とは何か? 標本とは何か? 母集団と標本の違いは? サンプリングするって? 母集団の代表値を推測するって? 分散を計算する(1.2)と(1.3)は同じでないが、その理由は第6章で明らかになる。