データ分析.

Slides:



Advertisements
Similar presentations
◎標本調査とその問題点 ● 何らかの情報を得たい全体集団(母 集団)から、ランダムに適当な数の標 本(サンプル)を抽出し、それに対す る調査結果から母集団に関する情報を 推定する方法 ● 全数調査(悉皆調査:国勢調査等) と比較して、費用・時間の面で極めて 効率的 ● 標本調査が十分にその機能を果たすためには.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
2006 年度 統計学講義内容 担当者 河田正樹
統計学入門2 - 後期 第 1 回 - 1 統計学入門2 講義内容の紹介 推測統計とは. 統計学入門2 - 後期 第 1 回 - 2 教科書 & 参考書 教科書 特に使用しない 参考書 「統計解析の基本と仕組み」 ( 秀和システム ) 「データ分析のための統計入門」(共立出版)
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
マーケティング機会分析: マーケティング・リサーチ
SPSS操作入門 よい卒業研究をめざして 橋本明浩.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
社会調査とは何か(3) 調査対象者の選定方法
Excelによる統計分析のための ワークシート開発
検定 P.137.
第2章 全数調査と標本調査 ー 経済統計 ー.
実証分析の手順 経済データ解析 2011年度.
統計学 12/3(月).
統計学 第3回 「データの尺度・データの図示」
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
データ分析2 1.平均値の比較のタイプ 2.対応のあるt検定 3.対応のないt検定 4.3つの以上のグループの差を調べる 5.参考文献
経済統計 第三回 5/1 Business Statistics
統計学 11/30(木).
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
担当者 河田正樹 2011年度 統計学基礎講義内容 担当者 河田正樹
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453)
市場調査のプロセス 企画段階.
マーケティング・リサーチ.
統計リテラシー教育における 携帯端末の利用
統計学 10/19 鈴木智也.
マイクロシミュレーションにおける 可変属性セル問題と解法
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計解析 第10回 12章 標本抽出、13章 標本分布.
調査対象の決定 (今日の目標) 1. 全数調査と標本調査の違いを理解する。 2. 標本調査の種類と特徴を理解する。 3.
統計解析 第1章 データの表現.
統計リテラシー育成のための数学の指導方法に関する実践的研究
経済情報処理ガイダンス 神奈川大学 経済学部.
データ分析基礎c(2012年以降入学) 情報編集基礎c(2011年以前入学)
統計学の基礎と応用 張 南   今日の話:序   論          履修の注意事項.
地理情報システム論演習 地理情報システム論演習
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成.
担当者 河田正樹 2018年度 統計学基礎講義内容 担当者 河田正樹
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
担当者 河田正樹 2010年度 統計学基礎講義内容 担当者 河田正樹
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
疫学概論 標本抽出法 Lesson 10. 標本抽出 §B. 標本抽出法 S.Harano,MD,PhD,MPH.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
第3章 統計的推定 (その1) 統計学 2006年度.
数量分析 第2回 データ解析技法とソフトウェア
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
経済情報処理ガイダンス 神奈川大学 経済学部.
クロス表とχ2検定.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
第2章 統計データの記述 データについての理解 度数分布表の作成.
サンプリングと確率理論.
Presentation transcript:

データ分析

授業の目標 データから情報を読み取るために、次の技術を身に つける データを適切な図表に表す データの数量的要約の方法とその意味について学ぶ データ間の関係を説明する 統計調査の方法(課題解決的アプローチ)を学ぶ 統計的推測、確率的思考の基礎を学ぶ

参考書・評価方法 参考書 成績評価:課題・小テスト・レポート 実データで学ぶ、使うための統計入門 D. ムーア、G. マッケイブ 日本評論社 参考書   実データで学ぶ、使うための統計入門    D. ムーア、G. マッケイブ          日本評論社  完全独習 統計学入門    小島 寛之   ダイヤモンド社  読む統計学 使う統計学  広田 すみれ                          慶応義塾大学出版会  統計学の基礎        中西寛子  多賀出版 成績評価:課題・小テスト・レポート

講義トピックス データとは・データの収集と分類 1次元データの記述(分布を見る) 正規分布 多次元データの記述(関係を見る) 時系列データの記述 経済時系列 回帰分析入門 統計的推測に向けて・確率論的思考

オフィス・アワー 金曜日 16:10~17:00 2号館8階 経済学部第10研究室 金曜日 16:10~17:00 2号館8階 経済学部第10研究室 メールによる質問も受け付けますが、必ず学籍番号と 氏名を入れてください!

授業についての注意 携帯 OFF! 私語・遅刻 厳禁 質問はいつでもOK! 授業中に発言(反応)しよう! 関係ないホームページを見ないこと! 私語・遅刻 厳禁  質問はいつでもOK! 授業中に発言(反応)しよう! 関係ないホームページを見ないこと! 5月13日(水)は4:30pmより行います  (1年生は懇親会に出席してください)

なぜ、データ分析(統計的分析)? 数量的情報(データ)はあらゆるところに存在 数量的情報(データ)はあらゆるところに存在     情報の賢い消費者になる    図表の読み方、数量情報に関する議論を理解する必要 私達の日常生活に影響を及ぼす様々なものが、統計的手 法により決定されている   病気の治療法・薬の認可 水道水の品質 保険料  将来、どのような職業についても、データに基づく意思決定 が必要に

データ分析(統計的分析)の目的 データから学ぶ! そのための手段が統計学 データを見やすく要約・記述 データの規則性を探す データを見やすく要約・記述  データの規則性を探す 1,2をもとに予測・推測、意思決定    データから学ぶ!      そのための手段が統計学 記述統計学 推測統計学

統計(statistics)とは 統計:集められた‘データの集合’自体 データ:ばらつきのある観測値の集合       データ:ばらつきのある観測値の集合 統計学: データから有益な情報(法則性)を引き出す方法     ---情報の賢い消費者になるために必要な技術 データを収集し、処理し、解釈するために用いられる手法

データ≠情報 360 300 420 840 330 400 240 480 600 180 540 380 270 120 280 450

統計的グラフによる表示

統計調査(課題解決的アプローチ) 調査企画(計画) 問題は何か? どのようなデータが必要か? データ収集 適切なデータの収集方法を計画、実行 調査企画(計画)    問題は何か? どのようなデータが必要か? データ収集    適切なデータの収集方法を計画、実行 データ整理(加工)    図表・数字を用いてデータを表現 データ分析    データの持つ情報を読み取る 結果を解釈 発表   必要であれば1.に戻る

データと変数(変量) 統計調査:あるグループ(母集団)についての情報を得るた めに、データを収集、分析 データ:観測または実験によって得られる値       他の人が集めたものを使うことも データ収集:母集団の要素(個体)を観測し、変数の値(デー タ)を測定   変数(変量): 各要素の性質 (特徴)          要素毎に異なる値 * 値に影響を及ぼさないよう観測することが大事

他人が集めたデータを調べるとき 何のために集められたデータか(目的) 何(誰)に関するデータか どのような特徴があるか  (変数はいくつあるか・変数は何か・各変数の単位 は?)

統計調査(データ収集) 全数調査:興味の対象となる集団(母集団)のすべての 構成員について調査 例) 国勢調査 商業統計 工業統計    例) 国勢調査  商業統計  工業統計 標本調査:興味の対象となる集団の一部についてのみ 調査    例) 家計調査  労働力調査   選ばれた一部:標本  

母集団と標本           母集団       標本調査                                                                    標本                                 記述統計学                  ×   × 要素 ×     ×    ×      × ×    × × ×   ×  ×       ×  推測統計学

記述統計学と推測統計学 記述統計学:データを 読みやすい形に要約、編集 推測統計学:標本データをもとに母集団の性質につい て推論

なぜ、標本調査? 費用の節減 時間の短縮 (データの調査及び集計) 母集団が無限である場合 情報の範囲の拡大 精度の向上 標本調査の欠点 費用の節減  時間の短縮 (データの調査及び集計) 母集団が無限である場合  情報の範囲の拡大  精度の向上 標本調査の欠点 地域別等の細分が困難 標本の偏り

偏った標本 調査しやすい要素を選択 例)箱詰めオレンジの品質調査 例)百貨店の客に対する調査 回答者が自らが調査に参加するか否かを決定   例)箱詰めオレンジの品質調査   例)百貨店の客に対する調査 回答者が自らが調査に参加するか否かを決定   例)電話による意思表示 恣意的な選択はバイアスをもたらす!

標本の選び方 有意抽出法 :調査者が意識的に標本の構成員を選ぶ 調査の精度、評価できない        調査の精度、評価できない 無作為抽出法 :調査者の主観が入らないように、機械 的な方法で標本を抽出すること(“偶然”を利用)     調査の誤差、客観的に評価可能

標本調査法(無作為抽出法) 無作為抽出  ① 単純無作為抽出法  ② 層別抽出法(単純無作為抽出の精緻化)  ③ 系統抽出法  ④ 多段抽出法

単純無作為抽出法 母集団の構成要素のそれぞれに1~Nまでの番号を ふる(母集団リスト作成) くじ引きの要領でn個抽出(乱数を用いる) 全ての構成要素に等しいチャンス 他の要素とは独立(無関係)に抽出

単純無作為抽出法の欠点 母集団が大きい場合、母集団リストの作成は困難 調査費用大 母集団に関する予備知識の利用により精度を上げる ことが可能

家計調査の場合 層化三段抽出法 第1段階:市町村の層別と抽出 第2段階:調査地区の無作為抽出 第3段階:調査世帯の無作為抽出 調査拒否をどれだけ減らすことが出来るか? 家計調査

調査における誤差 標本抽出誤差(標本調査に固有) たまたま偏りのある標本が選ばれる 誤差の大きさ、客観的に評価可能   たまたま偏りのある標本が選ばれる   誤差の大きさ、客観的に評価可能 非標本誤差(全数調査においても発生)  調査漏れ(リスト欠落・調査拒否)  回答・測定の偏り    こちらの方が深刻!

データの分類 質的データと量的データ 1次元データと多次元データ クロスセクションデータ・時系列データ・パネルデータ

質的データと量的データ(1) 性別 所有するPCのメーカー 郵政民営化への賛否 住居のある都道府県 etc. 数値として観測することができない   あるカテゴリー(項目)に属していることや、ある状態 にあることだけがわかる                   質的データ

質的データと量的データ(2) 家族の子供の数 預金残高 東京の年間降水量 所有するCDの枚数 etc. 本質的に数字で表されるもの                     量的データ

量的データ ① 離散的データ…とりうる数値がとびとびの場合 典型的には数えることにより得られる ① 離散的データ…とりうる数値がとびとびの場合      典型的には数えることにより得られる ② 連続的データ…数直線上の特定の範囲でどのよう な値でも取れる場合      典型的には測る(量る)ことにより得られる

質的データ ① 名義(名目)尺度を持つデータ 項目間に自然な順序は存在しない 例)性別 PCのメーカー ビール会社 ① 名義(名目)尺度を持つデータ    項目間に自然な順序は存在しない        例)性別 PCのメーカー ビール会社 ② 順序(順位)尺度を持つデータ    項目間に自然な順序が存在     例)ある商品をどう思うか      1.非常に良い 2.良い 3.まあまあ       4.悪い 5.非常に悪い     例)成績 S/A/B/C/D/E/F

計測形態による分類 クロスセクション(横断面)データ 各観測値が同一の時点(期間)のデータ   各観測値が同一の時点(期間)のデータ 時系列データ  各観測値が時間の順序に並んでいるもの パネルデータ  同一集団が繰り返し調査される場合