第1章 統計的方法の性質 高 尚策 (コウ ショウサク) 准 教授 1 富山大学知能情報工学科 「統計学」第1回 オリエンテーション
2 教科書・参考書 教科書 ポール G. ホーエル ( 著 ), 浅井 晃 ( 翻訳 ), 村上 正康 ( 翻訳 ) 出版社 : 培風館 参考書 「統計解析の基本と仕組み」 ( 秀和システム ) 「データ分析のための統計入門」(共立出版)
3 講義の進め方 講義 + 演習・実習 + レポート 練習問題・簡単な分析を実践 講義用パワーポイントの請求 まで 質問を受ける時間 在室時随時 (情報棟 5 階 5506 室) ※メールにてアポイントメントを取ること を推奨
4 本講義の構成 1. 記述統計学(表・グラフ・基本統計量) 第 2 章 標本データの記述 ( 2 回の講義にする) 2. 確率(確からしさの定式化) 第 3 章 確率 ( 2 回の講義) 第 4 章 確率分布 ( 1 回の講義) 第 5 章 重要な確率分布 ( 2 回の講義) 3. 推計学(推定・検定; 統計的推論) 第 6 章 標本抽出 (1回の講義) 第 7 章 推定 ( 2 回の講義) 第 8 章 仮説の検定 ( 2 回の講義) 第 9 章 相関と回帰 (1回の 講義) 3部構成(1と3が中心・2は基礎のみ)
5 成績評価 全体の 2/3 ( 10 回)以上の出席を満たさない場合 期末試験を受験できない (学内履修規定) 毎回講義後に演習問題を提示 最終日に期末試験を実施 演習問題 40 %・期末試験 60 % の比率で総合評価 演習と試験の合計得点を 100 点満点に換算 – 優: 80 点以上 – 良: 70 点以上~ 80 点未満 – 可: 60 点以上~ 70 点未満
言葉によって定義できないものがあ る -経済学者 ジョーン・ロビンソン “Reduction of Data” -推測統計学の創始者 R.A.Fisher 6 統計学 (Statistics) とは [ 目的 ] 全体を見ること × 平均などの指標を計算すること ○ 分布全体の傾向や特徴を抽出すること つまり、 データから有効な情報を取り出すこと 多くの場合,母集団に関する推論を行うことを意味す る 『統計的方法とは母集団に関する結論を標本から 引き出す方法である.』(テキスト p.3 ) [ 特徴 ] 帰納的 × 演繹論理(数学・論理学的な世界:一般 ⇒ 特殊) ○ 帰納論理(推理・推論の世界:特殊 ⇒ 一般)
7 調査の例 世論調査 – 内閣支持率、政策に対する意見... 視聴率調査 – 野球中継の視聴率、人気ドラマの... マーケティングリサーチ – 人気のある商品は... 、 理由は......
8 統計調査の例(その 1 ) (YOMIURI ONLINE より )
9 統計調査の例(その 2 ) 調 査 日 時調 査 日 時ミッテラン ジスカール デスタン 4月27日~28日 5月 2日~ 4日 5月 6日 月 7日 5月 8日 5月10日 ( 投票日 ) 表. フランス大統領選挙 by Le Monde 紙 単位:パーセンテー ジ
10 統計調査の例(その 3 ) 肺がん患者正 常 喫 煙 者 60 32 非喫煙者 3 11 表. 喫煙と肺がん 単位: 人
11 推測 知りたい対 象 (未知な調査対 象) 得られた データ (分析可能) 調査 記述統計 確率( sampling ) 確率(推定・検定) 母集団 標本 調査の流れ
母集団と標本の定義 母集団( population ): 興味のある対象全体. 性質を明らかにしたい対象集団.観測値の原泉 (テキスト p.3 ) . 標本( sample ): 観測値の集まり (テキスト p.3 ) . 母集団の一部を標本 (データ) として取り出し、取 り出された標本に、統計的手法を適用することで 母集団に関する結論が得られる . [ 比喩:スープの味見 ] 12 母集団 の一部を 標本 (データ) として取り出す → 取り出された標本に 統計的手法 を適用する → 母集団 に関する結論が得られる . [ 比喩:スープの味見 ]
13 母集団と標本の関係 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報 = データ 情報の抽出 記号 : { x 1, x 2, …, x n } 各種の代表値 統計的推測 (帰納論理:特殊 ⇒ 一般)
母集団の例 選挙での,有権者(あるいは投票者)全 体 – 選挙速報は,一部の有権者に対する出口調査 や開票結果から,母集団での支持割合(得票 数)を推測する. (テキスト p.5 例 (a) 参照) 特定の年齢層の子どもを対象とした薬を 開発するときの,その年齢層の子ども全 体 – 何人かの子どもに対して実験を行い,薬の効 果を検証する. (テキスト p.5 例 (b) 参照) 14
全数調査と標本調査 母集団全体のデータを取得することは大変な手 間がかかることが多い. – 調査では,全数調査 あるいは 悉皆(しっかい)調査 と呼ばれる( complete survey ) . 例:国勢調査 母集団から「うまく」標本を抽出すれば,小さ な標本でも,母集団に関する精度の高い推測が 可能. – 無作為抽出( random sampling )を行う. (テキスト第6 章) 15
16 全数調査と標本調査の特徴 全数調査 – 標本誤差がない – 調査終了まで時間 がかかる – 膨大な費用 標本調査 – 時間と調査費用の節 約 – 標本抽出の方法如何 では、標本誤差が推 定可能 全数調査標本調査 標本誤差がない 標本抽出の方法次第で 標本誤差を推定 膨大な時間と調査費用時間と調査費用の節約
記述統計と推測統計 記述統計( descriptive statistics ) データの収集,要約に関する統計学 (テキスト p.4 ) . 得られたデータを要約する. – 標本データの要約 – 小さな母集団(学級など)でのデータの要約 推測統計( statistical inference ) 母集団に関する結論を引き出す統計学 (テキスト p.4 ) . 17