データ分析入門(3) 第3章 データの収集と編成 廣野元久.

Slides:



Advertisements
Similar presentations
はじめてのパターン認識 第1章 第4グループ 平田翔暉. パターン認識 パターン認識 o 観測されたパターンを、あらかじめ定められ たクラスに分類すること クラス o 硬貨: 1 円玉、 5 円玉、 10 円玉、 50 円玉、 100 円玉、 500 円玉 o アルファベット: 26 種類 o 数字:
Advertisements

計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
データ分析第2回授業 第 2 章データ分析の進め方 第 3 章データの収集と編成. データ分析の手順 研究テーマの選択 仮説の設定 計画の立案 データの収集 収集したデータの吟 味 データの分析 分析結果の検討 考察と結論 報告書の作成 発表.
経済予測入門Ⅰ 第2回 内容 (1)時系列データ (2)データの季節性 前年同期との比較 季節調整 (3)景気動向指数(内閣府、DI)
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
1 データ分析入門( 8 ) 第 8 章 散布図と相関係数 廣野元久. 第 8 章 散布図と相関係数 廣野元久 &高橋行雄 2/28 本章の概要 2つの量的データのばらつき方を調べ, その関連 ( 相関関係 ) をグラフと数値で評価する 2変量間の相関関係には, 因果関係と擬似相関があるため, 関連を見誤らないように,
第5章 JMPのインストールと基本操作 廣野元久
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
SPSS操作入門 よい卒業研究をめざして 橋本明浩.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
データ分析入門(7) 第7章 データの操作と比較 廣野元久.
④CiNii ⑤NDL-OPAC(雑誌記事) ⑥日経BP
課題 1 キーボードから整数値を 1つ読み込み、その値の二乗と三乗を出力するプログラムを作れ。 動作例: % ./a.out
Excelによる統計分析のための ワークシート開発
Excel による データベース入門 Ver /9.
ブランド価値の評価.
実証分析の手順 経済データ解析 2011年度.
統計学 第3回 「データの尺度・データの図示」
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
情報リテラシー(1) ガイダンス 情報リテラシ2003 野村松信・須藤秀紹.
レポート・論文のための 資料の探し方講習会 統計資料編
データ分析入門(10) 第10章 クロス集計表と仮説検定 廣野元久.
     総合原価計算.
教育学部「文章作成法I」 (水)1講時 茨城大学図書館・情報支援係
練習問題4.
データ分析入門(9) 第9章 データの品質 廣野 元久.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
マーケティング・リサーチ.
統計学 第3回 10/11 担当:鈴木智也.
統計学 10/19 鈴木智也.
経済データのダウンロードと グラフの作成 経済データ解析 2011年度.
データ分析入門(13) 第13章 主成分分析 廣野元久.
14回. まとめ 情報のまとめかた DBの利用 情報検索の留意点 情報検索と情報収集 68 基礎知識の必要性 68
12月4日 伊藤 早紀 重回帰分析.
Webで恋愛の類型を測り集計しレポートにまとめる
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
調査結果の集計 集計と尺度 調査企画→調査票の作成・サンプリング→フィールドワーク→集計→分析→調査票の作成
データ分析基礎c(2012年以降入学) 情報編集基礎c(2011年以前入学)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
地理情報システム論演習 地理情報システム論演習
企業を調査客体とする統計調査の 回収率の最近の動向について 日本統計学会 (大阪大学) 国士舘大学 山田 茂
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
ブランドの評価と測定.
行政保有データ(統計関連)の棚卸し集計結果 (平成29年12月取りまとめ)
経済データのダウンロードと グラフの作成 経済データ解析 2009年度.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
analysis of survey data 堀 啓造
※内容は初版刊行当時のものです。 OPACで図書を探してみよう 学術情報総合センター情報サービス部門.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
OPACを利用するに あたって 学術情報総合センター医学部分館 1 学術文献の量 2 看護関係図書・雑誌の探し方 3 図書資料の配架場所
第10回:Microsoft Excel (2/2)
行政保有データ(統計関連)の棚卸し結果概要 (平成29年12月取りまとめ)
BSJ特別セッション(2001、甲子園大学) 「人間科学データの蓄積と利用」 指定討論2 林 篤裕 (大学入試センター)
都市・港湾経済学(総) 国民経済計算論(商)
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
1. API機能による統計データの高度利用環境の構築
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
第2章 統計データの記述 データについての理解 度数分布表の作成.
調査結果の集計 集計と尺度 調査企画→調査票の作成・サンプリング→フィールドワーク→集計→分析→調査票の作成
回帰分析入門 経済データ解析 2011年度.
30分でわかる 統計資料の探し方 平成22年10月29日 茨城大学図書館 図書館キャラクター 「わらづと君」 茨城大学図書館.
行政保有データ(行政手続等関連)の棚卸結果概要 (平成31年3月とりまとめ)
Presentation transcript:

データ分析入門(3) 第3章 データの収集と編成 廣野元久

本章の概要 データの性質と測定の尺度 データの探し方 データの編成と入力準備 量的なデータ 質的なデータ 政府官庁データ,民間のシンクタンクなど データの編成と入力準備 データ表 第3章 データの収集と編成 廣野元久 &高橋行雄

1.データの性質と測定尺度 1.1量的データ 1.2質的データ 1.3測定の尺度 間隔尺度,比例尺度 名義尺度,順序尺度 間隔尺度,比例尺度      1.2質的データ 名義尺度,順序尺度      1.3測定の尺度     第3章 データの収集と編成 廣野元久 &高橋行雄

1.1 量的データ 量的データ:Quantitative Data 変量:与えられた確率で,色々な値を取る もの 1.1 量的データ 量的データ:Quantitative Data 連続的に変化するもの :体重,身長,気温    連続変量:Continuous Variate:計量データ 整数値しかとらないもの:結婚件数,勝敗 離散変量:Discrete Variate  :計数データ 変量:与えられた確率で,色々な値を取る    もの 第3章 データの収集と編成 廣野元久 &高橋行雄

1.1 変量:サイコロを例にとると いかさまのないサイコロの目の出方は, 平等であるから,1/6の確率で出現する 第3章 データの収集と編成 1.1 変量:サイコロを例にとると いかさまのないサイコロの目の出方は, 平等であるから,1/6の確率で出現する 第3章 データの収集と編成 廣野元久 &高橋行雄

1.2質的データ 質的データ :Qualitative Data 質的データを計るには 状態や評価を表す,直接量れないデータ 例) 材料メーカーの評価の違い A社のパスタソース,B社のパスタソース 質的データを計るには 状態を評価する評価用語の利用 (評価の)分類に用いた区分をカテゴリ (Category,Class) 第3章 データの収集と編成 廣野元久 &高橋行雄

1.2 評価や状態の区分例(1) あなたは,A社のデジカメの写りについてどのくらい満足していますか 1.大変満足している  2.まあ満足している 3.普通である      4.やや不満である   5.大変不満である 評価に順序がつく回答肢に得点をつけることもできる 1. 5点  2. 4点 3. 3点    4. 2点  5. 1点          など 第3章 データの収集と編成 廣野元久 &高橋行雄

1.2 評価や状態の区分例(2) あなたは,A社のデジカメの写りの色合いについてどうお思われますか 1.緑みが強い     2.赤みが強い 3.黄みが強い     4.青みが強い 評価に順序がつかないので回答肢に得点をつけることは無意味 第3章 データの収集と編成 廣野元久 &高橋行雄

1.3測定の尺度(1) 比例尺度(Ratio Scale) 原点(0)に意味がある. 0~∞(とっても大きい値)をとる 間隔や比率に意味がある データの加減乗除ができる. 物理量(絶対温度,抵抗値),工場の不良率など 地震のマグニチュードなど 第3章 データの収集と編成 廣野元久 &高橋行雄

1.3測定の尺度(2) 間隔尺度(interval Scale) 原点(0)に意味がない(移動可能) -∞から∞までの値をとる 摂氏や華氏は間隔尺度 摂氏は,水が氷になる温度を便宜的に0℃ -∞から∞までの値をとる SFCのΩ館を基点(0)にして東を+,西を-にして  距離をmで測る 間隔には意味がる データの足し算,引き算ができる 第3章 データの収集と編成 廣野元久 &高橋行雄

1.3測定の尺度(3) 連続尺度(Continuous Scale) 比例尺度と間隔尺度をまとめる 実際のデータ分析では,両者は同じように取り扱う JMPでも両者を区別しない 皆さんも,いまは神経質になる必要はない 第3章 データの収集と編成 廣野元久 &高橋行雄

1.3測定の尺度(4) 順序尺度(Ordinal Scale) 名義尺度(Nominal Scale) JMPでも順序尺度と名義尺度は区別 カテゴリの順序はつくが,間隔や比が不明 先の満足度の設問について,各カテゴリにどのような配点をするのか厳密には難しい 加減乗除には意味がない 名義尺度(Nominal Scale) カテゴリの順序さえつかない          (評価に方向がない) JMPでも順序尺度と名義尺度は区別 第3章 データの収集と編成 廣野元久 &高橋行雄

1.3測定の尺度(4) まとめ 第3章 データの収集と編成 廣野元久 &高橋行雄

2 データの収集 2.1 データの種類 2.2 データの調査・作成主体 2.3 データの利用 2.2.1 政府機関のデータ 2 データの収集 2.1 データの種類 2.2 データの調査・作成主体 2.2.1 政府機関のデータ 2.2.2 企業や民間の諸機関 2.3 データの利用 2.3.1 データ利用の社会的ルール 2.3.2 統計データの探索 2.3.3 社会調査データの探索 第3章 データの収集と編成 廣野元久 &高橋行雄

2.1 データの種類 集計データ(Aggregate Data) 個票データ(Individual data) 2.1 データの種類 集計データ(Aggregate Data) 個別調査の結果を調査票から集計してあるデータ 全体の傾向や集計単位ごとの比較など 情報公開度は高い 個票データ(Individual data) 集計前の原データ 集計データよりも細かい情報を必要とする場合 情報公開度は日本では僅か,ルールなど未整備 第3章 データの収集と編成 廣野元久 &高橋行雄

データの作成:簡単なアンケート Excel の使用経験、データの編成は? 第3章 データの収集と編成 廣野元久 &高橋行雄

集計データの例 第3章 データの収集と編成 廣野元久 &高橋行雄

個票の例 第3章 データの収集と編成 廣野元久 &高橋行雄

2.2.1 政府機関のデータ(1) (1)政府統計 大規模,継続性,信頼性,優れている 日本 第一義統計(調査統計) 2.2.1 政府機関のデータ(1) (1)政府統計 大規模,継続性,信頼性,優れている 日本 第一義統計(調査統計)  国勢調査,事業所統計調査,工業統計調査 など 第二義統計(業務統計)  通関統計,犯罪統計,司法統計 など 加工統計  経済統計,鉱工業生産指数 第3章 データの収集と編成 廣野元久 &高橋行雄

2.2.1 政府機関のデータ(2) (2)行政情報 白書,インターネット情報 テーマ,話題別の情報(非長期,非継続的) 非公開なものもある 2.2.1 政府機関のデータ(2) (2)行政情報 白書,インターネット情報 テーマ,話題別の情報(非長期,非継続的) 非公開なものもある 第3章 データの収集と編成 廣野元久 &高橋行雄

感染症のデータ(例) http://idsc.nih.go.jp/kanja/monthlydata/data99-3s.html 第3章 データの収集と編成 廣野元久 &高橋行雄

データの取り込み(例) 第3章 データの収集と編成 廣野元久 &高橋行雄

2.2.2企業や民間の諸機関 企業内情報(非公開) 業界団体情報 調査機関 報道機関:新聞紙面など 学術研究機関:刊行物の発行 2.2.2企業や民間の諸機関  企業内情報(非公開) 財務指標,満足度,市場動向,技術動向 業界団体情報 場合によっては公開 消費者センター(製品情報など公開)    調査機関 販売,コンサルタント,モニターの貸出し 報道機関:新聞紙面など 学術研究機関:刊行物の発行 第3章 データの収集と編成 廣野元久 &高橋行雄

2.3 データの利用 2.3.1 データ利用の社会的ルール 2.3.2 統計データの探索 2.3.3 社会調査データの探索 2.3 データの利用 2.3.1 データ利用の社会的ルール 2.3.2 統計データの探索 (1)統計情報の索引 (2)総合統計書,年鑑類 (3)統計データベースとインターネット 2.3.3 社会調査データの探索 (1)世論調査の索引 (2)データアーカイブ 第3章 データの収集と編成 廣野元久 &高橋行雄

2.3.1 データ利用の社会的ルール データにも著作権,DBや書籍にも著作権 淑女紳士的態度で利用しよう 利用データの出典を明らかにする 2.3.1 データ利用の社会的ルール データにも著作権,DBや書籍にも著作権 日本は著作権に対してルーズな国と思われている 淑女紳士的態度で利用しよう 利用データの出典を明らかにする 著者,書籍,DB,発行年など DBなどは,利用ルールを厳守する 個票データにはプライバシーの保護を!!! 情報公開とプライバシー保護の問題は難しい 第3章 データの収集と編成 廣野元久 &高橋行雄

2.3.2 統計データの探索 統計情報の索引から統計調査項目を利用 年鑑類から数字を見ながら探す (1)統計情報の索引 2.3.2 統計データの探索 統計情報の索引から統計調査項目を利用 年鑑類から数字を見ながら探す データの出典なども利用 (1)統計情報の索引 統計情報インデックス,統計調査総覧 データ出典などにより直接,役所へ問い合わせる (2)総合統計書,年鑑類 日本統計年鑑,朝日年鑑,読売年鑑, 国連世界統計年鑑,理科年表 統計データベース(CD ROM)とインターネット 検索エンジンの利用 日経NEEDS など 第3章 データの収集と編成 廣野元久 &高橋行雄

2.3.3 社会調査データの探索 (1)世論調査の索引 (2)データアーカイブ 世論調査年鑑 統計データの保存,蓄積,利用 機関 米国は先進国(情報化大国IT戦略) 世論調査:ローパーセンター 社会科学:コンソーシアム 第3章 データの収集と編成 廣野元久 &高橋行雄

3.データの編成 生の食材は扱いにくい データも分析しやすいように表にまとめる 野菜は,丁度良い大きさに切り揃える 魚は,焼く場合も,皮がパリと焼けるよう包丁をいれる データも分析しやすいように表にまとめる データを取ってから編成を考えてはダメ データ分析のストーリに沿って収集&編成 第3章 データの収集と編成 廣野元久 &高橋行雄

3.1 データの編成 分析の目的に応じて, データを並べる順序を示す編成を変える 時間の推移による状況を把握するには,データは時間順序に 時系列データ;Time Series Data 株価や為替の分析 寿命の分析(Survival Data) 同じ時点について,異なる対象を観測して,その特徴を調べる クロスセクションデータ;Cross-Section Data 工程データは,変数の取られる工程順に 特徴が近いと思われる項目を近くに配置する データ分析後に並べ替えられることもある 複数時点での異なる対象を観測(3元データ);Panel Data 第3章 データの収集と編成 廣野元久 &高橋行雄

データの編成(時系列データ) 項目 i 時間 t シャトーXXX(ボルドー赤ワイン) の初出荷時の価格 第3章 データの収集と編成 第3章 データの収集と編成 廣野元久 &高橋行雄

データの編成(クロスセクションデータ) レーザープリンタの画質評価 項目 i 地域,種類,個体,刺激など j 第3章 データの収集と編成 地域,種類,個体,刺激など j 第3章 データの収集と編成 廣野元久 &高橋行雄

データの編成(パネルデータ) 時間 t 個体 k(官能評価など) 項目 i 地域,種類,個体,刺激など j 第3章 データの収集と編成 第3章 データの収集と編成 廣野元久 &高橋行雄

3.2 データ入力のための準備 このデータを実際にJMPに取り込んでみよう 第3章 データの収集と編成 廣野元久 &高橋行雄

3.2 データ入力のための準備 列情報 で指定 データは番号など 第3章 データの収集と編成 廣野元久 &高橋行雄

関連Webリンク集を選ぶ 第3章 データの収集と編成 廣野元久 &高橋行雄

学協会・各種団体・…を選ぶ 第3章 データの収集と編成 廣野元久 &高橋行雄

円グラフの例 http://www.jiko.nite.go.jp/ 第3章 データの収集と編成 廣野元久 &高橋行雄

円グラフの例 http://www.jiko.nite.go.jp/ 第3章 データの収集と編成 廣野元久 &高橋行雄

帯グラフの例 http://www.jiko.nite.go.jp/ 第3章 データの収集と編成 廣野元久 &高橋行雄