担当者 河田正樹 E-mail kawada@tokuyama-u.ac.jp 2008年度 統計学講義内容 担当者 河田正樹 E-mail kawada@tokuyama-u.ac.jp
このスライドの内容 統計学とはどのようなものか 経済学と統計学 データの収集、分析をおこなう統計学は、学問として存在しているばかりでなく、日常生活の中で無意識のうちにその考え方が用いられているものである。 経済学と統計学 経済学部という文系の学部で統計学という数学のようなものはあまり関係ないように思われるが、経済学を学ぶ上で統計学は非常に重要なものであり、現実経済の把握や将来の予測には統計学が必ず用いられる。
統計学とはどのようなものか 日常生活において、われわれは不確実なことがらにさまざまな情報を用いて、予測し、意思決定をおこなっている。 (例) 駅までバスでいくときには、 〇 通常の所要時間の情報 に加え 〇 曜日、季節、時間帯、天候などによる混雑度の情報 を用いて、所要時間を予測し、行動する。
通常の所要時間の情報、混雑度の情報をどのように入手し、どのように利用しているのであろうか? 普段からよく乗るバスであれば、大体の所要時間を記録(多くの人は脳の中で)している。 平均所要時間と最大所要時間を大まかに計算している。 さらに、曜日・時間帯・天候などで場合分けし、それぞれの場合の平均所要時間と最大所要時間を大まかに計算している。 ⇒ 実は無意識のうちに「統計学的なものの考え方」を用いている。
統計学 統計学とは、分析目的に対応してデータを収集し、分析することによって、予測や意思決定のための材料を提供する学問である。 予測・ データの収集 分析
データを収集し、分析する統計学の立場には次の2種類が考えられる。 データを収集し、分析する統計学の立場には次の2種類が考えられる。 まず、得られたデータの特徴を何らかの数値(例えば平均)や表・グラフにまとめたりすることが考えられる。 ⇒ 記述統計(または統計的記述)という。 次に、データの記述にもとづき、そのデータを生成した集団や構造(これを母集団という)についての推論をおこなうことが考えられる。 ⇒ 推測統計という。
毎日すべての時間帯のバスに乗り、所要時間のデータを収集することは不可能であるので、その中の一部を標本(サンプル)として選ぶ。 毎日すべての時間帯のバスに乗り、所要時間のデータを収集することは不可能であるので、その中の一部を標本(サンプル)として選ぶ。 母集団(個体数N) × × × × × × × 標本(個体数n) × × × ×
標本から得た母集団についての情報は、誤差を持っている。 たとえば、晴れた平日の夕方にAさんとBさんがそれぞれ別の日にバスに乗ってデータ収集をおこなう。 Aさんは10回乗ったところ、目的地まで平均15分でついた。 Bさんは運の悪い人で、乗ったバスが信号に何度もつかまり、10回乗ったところ平均時間は20分であった。 ⇒ 選んだ標本(サンプル)から求めた平均所要時間には誤差がある。 ⇒ 標本誤差の問題 推測統計では、標本から得られる情報にもとに、確率を用いて、誤差の大きさを評価し、母集団についての情報を推論する。
推測統計の例 -視聴率- ドラマやスポーツなどのテレビ番組の視聴率は、ビデオリサーチ社が調査している。 推測統計の例 -視聴率- ドラマやスポーツなどのテレビ番組の視聴率は、ビデオリサーチ社が調査している。 全国を各地区に分け、視聴率を調べているが、新聞などで大きく取り上げられるのは、関東地区の結果である。 関東地区の場合、約1580万世帯のうち、600世帯を標本(サンプル)として選び調査している。 母集団(1580万世帯) × × × × × × × 標本(600世帯) × × × ×
(例) 名古屋国際女子マラソン(2008.3.9放送)の視聴率は25.7%であった。 テレビ局の論理 1580万世帯×0.257 = 406万世帯が視聴している。 視聴率が1%増えるということは、関東地区だけで 1580万世帯×0.01 = 15万世帯増加 全国では4700万世帯×0.01 = 47万世帯(その世帯に住む人数を考えると約100万人の増加) ⇒ 標本誤差を考慮せず、標本から求めた視聴率が母集団から求めた視聴率に等しいとしている。
統計学の論理 標本の600世帯×0.257 = 154世帯が視聴しているということ。 視聴率が1%増えるということは、600世帯×0.01 = 6世帯がたまたまその番組を見ていたことである。 1%程度の視聴率は標本誤差によって変わる可能性がある。
では、標本調査で25.7%という結果を得た場合、母集団の視聴率はどの程度なのだろうか? ⇒ これに答えるのが統計的推定 ⇒ これに答えるのが統計的推定 視聴率25%以上の番組を作った場合、プロデューサーの査定にプラスになるという内規があったとする。しかし、この番組は本当に25%を超えたのだろうか? ⇒ これに答えるのが統計的検定 ※ 2003年10月に発覚した、視聴率操作事件をおこした日本テレビプロデューサーは、視聴率のわずかな差にこだわっていたが、統計学の立場からすると、わずかな差にこだわるのはバカバカしい。
経済学と統計学 経済学を学ぶ場合、マクロ経済学やミクロ経済学などの経済理論を学ぶとともに、それらが現実経済と一致するかを検証しなくてはならない。 一致? 現実経済 経済理論
現実経済の状態を把握するために、記述統計が用いられる。 完全失業率を算出する 株価の動きをグラフ化する 所得税減税効果と、消費増大の関係について、回帰分析をおこなう。 → 所得税を○○%引き下げることによって、消費が△△%増大する さらに、現状把握をもとに予測し、意思決定をおこなうためには、推測統計が用いられる。
完全失業率は、これは日本全国15歳以上(1億人)から10万人を標本として選んだ調査の結果である。この数値が前月と比べて0 完全失業率は、これは日本全国15歳以上(1億人)から10万人を標本として選んだ調査の結果である。この数値が前月と比べて0.1%増えたところで、誤差の範囲内ではないだろうか? 所得税を○○%引き下げることによって、消費が△△%増大することが回帰分析によってわかった。しかし、この分析は標本にもとづいて分析されたものであり、実際には ± □% の誤差がある。 ⇒ 誤差をふまえたうえでの意思決定が必要
マーケティングと統計学 マーケティングと統計学は密接な関係がある。 コンビニなどのPOSシステムのデータは、天候、時間、年齢、性別などによってどのような商品が売れるのかを解析するために用いられている。 市場調査のためにアンケートをおこなう場合には、調査対象者をどのぐらいの規模でどのようにして選ぶかなどには統計学の知識が必要不可欠である。(統計的推定に含まれるサンプリング(標本抽出法)の話)
スポーツと統計学 スポーツの戦術、トレーニング方法などを科学的に解明する場合、統計学の助けが必要となる。 野球の戦術において、打率、防御率などはどの選手をどのように起用するか(打順、登板順など)に用いられるし、投手の配球を読む上で統計学は非常に役に立つ。選手の起用に際して、メジャーリーグのアスレチックスを起源とするでは「セイバーメトリクス」という統計的分析手法が出てきており、OPS(On-base Plus Slugging)という出塁率+長打率で求められる指標が、得点との関連が高いことがいわれている。 トレーニングの面では、2つのトレーニング方法があった場合、どちらがより効果的なトレーニング方法であるかなどは、統計的検定によって検証される。
講義内容 第1章 記述統計の復習 第2章 確率と確率分布 第3章 統計的推定 第4章 統計的検定 第5章 回帰分析入門