データ分析入門(1) 第1章:データ分析への招待 廣野元久.

Slides:



Advertisements
Similar presentations
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
Advertisements

社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
QC七つ道具 工業高校におけるキャリア教育 高等学校(工 業) パレート図パレート図 特性要因図 ヒストグラム チェックシート 散布図 グラフ 管理図 層別特性要因図ヒストグラムチェックシート散布図グラフ管理図層別.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 データ分析入門( 8 ) 第 8 章 散布図と相関係数 廣野元久. 第 8 章 散布図と相関係数 廣野元久 &高橋行雄 2/28 本章の概要 2つの量的データのばらつき方を調べ, その関連 ( 相関関係 ) をグラフと数値で評価する 2変量間の相関関係には, 因果関係と擬似相関があるため, 関連を見誤らないように,
第5章 JMPのインストールと基本操作 廣野元久
当社の 「品質マネジメントシステム」(QMS)の 今後の運用について
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
グラフィカル多変量解析 ----目で見る共分散構造分析----
データ分析入門(12) 第12章 単回帰分析 廣野元久.
平成14年2月8日 卒業研究報告 相関行列に基づく非計量多次元尺度法 に関する研究
データ分析入門(7) 第7章 データの操作と比較 廣野元久.
経済統計学 担当者:張 南.
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
QC 7つ道具 【①グラフ:可視化】 データを集め、可視化することによって、状況が把握しやすくなる。
QC 7つ道具 【①グラフ:可視化】 データを集め、可視化することによって、状況が把握しやすくなる。
Excelによる統計分析のための ワークシート開発
コメント 「ファセット・アプローチの 魅力とパワー」
収量を推測する -Excel- 2011年6月24日 理学部3回 青木陽輔.
仮説の立て方、RQの絞り方 論文を考える根本的思考 担当・柴田真吾
実証分析の手順 経済データ解析 2011年度.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
生物統計学・第3回 全体を眺める(2) 主成分分析
データ分析入門(10) 第10章 クロス集計表と仮説検定 廣野元久.
経済情報処理ガイダンス 神奈川大学 経済学部.
マーケティング・リサーチ オリエンテーション.
保健学習の進め方・指導案の書き方 さいたま市立三橋小学校   豊島  登.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
貧困と出産の関係.
因果関係3原則 2009年月曜日・3時限 社会理論と調査法.
統計学 第1週 9/27(木) 担当:鈴木智也.
データ分析入門(13) 第13章 主成分分析 廣野元久.
12月4日 伊藤 早紀 重回帰分析.
経済情報処理ガイダンス 神奈川大学 経済学部.
回帰分析/多変量分析 1月18日.
統計リテラシー育成のための数学の指導方法に関する実践的研究
マーケティング 第2部 マーケティング・リサーチ
経済情報処理ガイダンス 神奈川大学 経済学部.
確率と統計 Probability & Statistics
確率と統計 Probability & Statistics
2010/04/8 情報システム学科 情報システム演習1 担当:小宮山智志
離婚が出生数に与える影響 -都道府県データを用いた計量分析
第13回 QC7つ道具(データの可視化・活用) 経営情報論A
Evidence-based Practice とは何か
シミュレーション論 Ⅱ 第15回 まとめ.
データ解析 静岡大学工学部 安藤和敏
マーケティング・マネジメント ウィラワン・ドニ・ダハナ 火曜日2時限.
教育工学を始めよう ~研究テーマの選び方から論文の書き方まで~ (第1章)
データ解析 静岡大学工学部 安藤和敏
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
数量分析 第2回 データ解析技法とソフトウェア
予測に用いる数学 2004/05/07 ide.
担当者: 河田 正樹 年度 管理工学講義内容 担当者: 河田 正樹
東京工科大学 コンピュータサイエンス学部 亀田弘之
疫学概論 ヘルシンキ宣言 Lesson 23. 疫学研究の倫理 §A. ヘルシンキ宣言 S.Harano, MD,PhD,MPH.
統計学の入門講義における 達成動機,自己効力感,およびテスト成績の関連
日本の高校における英語の授業は 英語がベストか?
その他 手法の組合せ.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
担当者: 河田 正樹 年度 管理工学講義内容 担当者: 河田 正樹
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
回帰分析入門 経済データ解析 2011年度.
平成22年度    計 量 心 理 学  a.
2010応用行動分析(3) 対人援助の方法としての応用行動分析
Presentation transcript:

データ分析入門(1) 第1章:データ分析への招待 廣野元久

第1章の概要 実り豊かな数量データの分析のために 必要な知識と手法 難しい統計の理屈は抜きにして道筋を理解しよう お宝の発見と効果 有効な方法論を自分でデータ分析することで 体得(実学)しよう 習得すべき能力 観察力を磨き,問題提起能力と,それを解決するためのセンスを磨こう 第1章 データ分析への招待 廣野元久 &高橋行雄

1 なぜデータ分析するか 1/2 世の中の情報には, 数量データが多く見かけられる ex.日経 環境経営度, 顧客満足調査,内閣支持率 1 なぜデータ分析するか 1/2 世の中の情報には, 数量データが多く見かけられる ex.日経 環境経営度, 顧客満足調査,内閣支持率 離婚率,スポーツの成績 など       個人・企業・国家の行動決定の資料 リスクの計算, 予測,要約など 我々が毎日,食事を取るのと同様に, 数量データに基づいて,意思決定がなされている 誤った判断をしない(リスクを回避する)ために データ分析を行い,その結果を判断に反映させる 第1章 データ分析への招待 廣野元久 &高橋行雄

1 なぜデータ分析するか 2/2 データは お宝が埋まっている金鉱脈 自身の目的にあった(お宝を採取するために), 1 なぜデータ分析するか 2/2 データは お宝が埋まっている金鉱脈 自身の目的にあった(お宝を採取するために), データを選別し,データを要約するデータ分析が必要    杜氏がよい大吟醸をつくるために米を磨くようなもの    Mining で留まらない、もっとPolish upする 自然科学系の実験研究データ(仮説検証) 社会科学系の観察研究データ(調査,仮説探索) 第1章 データ分析への招待 廣野元久 &高橋行雄

なぜ臨床試験を行うか(例) ヒトを対象とする医学研究の第一の目的は、予防、診断及び治療方法の改善並びに疾病原因及び病理の理解の向上にある。最善であると証明された予防、診断及び治療方法であっても、その有効性、効果、利用し易さ及び質に関する研究を通じて、絶えず再検証されなければならない。 http://www.med.or.jp/wma/helsinki02_j.html 第1章 データ分析への招待 廣野元久 &高橋行雄

2.データ分析に必要な知識 2.1 分析手法と理論 2.2 データ収集と研究計画 2.3 対象分野の事前知識と判断力 2.1 分析手法と理論 2.2 データ収集と研究計画 2.3 対象分野の事前知識と判断力 第1章 データ分析への招待 廣野元久 &高橋行雄

2.1 分析手法と理論 データ分析のツールは星の数ほどある 1変量の分析 ヒストグラム,棒グラフなど 2変量の分析 散布図,クロス表など 2.1 分析手法と理論 データ分析のツールは星の数ほどある 1変量の分析 ヒストグラム,棒グラフなど 2変量の分析 散布図,クロス表など 多変量の分析 主成分分析,回帰分析など 数量データの要約から因果関係へ パス解析,共分散構造分析 など 計数データの要約,数量化 対応分析や対数線形モデルなど 第1章 データ分析への招待 廣野元久 &高橋行雄

JMPデータ分析例 (ユーザ提供フォルダ内の選挙データ2001より(V5.1Jから) 第1章 データ分析への招待 廣野元久 &高橋行雄

1変量の分析の例 (00年衆議院選挙,01年参議院の自民得票率) 沖縄県 リンク機能 大都市を抱える都道府県を選択 得票率のヒストグラムで対応する領域が濃く表示される 1変量の分布を使い,自民党の得票率のヒストグラムを描画してみよう 00年より01年の選挙の方が自民党の得票率は伸びている  相対的に大都市を抱える都道府県では得票率は伸びていない   第1章 データ分析への招待 廣野元久 &高橋行雄

2変量の分析例 (00年衆議院選挙,01年参議院の自民VS共産) 2変量の関係を使い主成分(直交回帰線)を追加した散布図 00年01年関わらず、得票率による都道府県の自民党VS共産党では,   負の相関関係(対立)が認められるが、01年は自民党が躍進している。 00年01年の比較では各県の相対的な布置は沖縄県以外ほぼ同じで   大都市圏の方が共産党の得票率は伸びている。  第1章 データ分析への招待 廣野元久 &高橋行雄

2変量の分析 (00年衆議院選挙,01年参議院の自民得票率) 2変量の関係を使い,投票数150万票で区切ったときの比較 相対的に大都市を抱える都道府県では自民党得票率は伸びていない 相対的に大都市を抱えていない都道府県でも,岩手,長野などでは  自民党が苦戦している. 01年では,沖縄県の自民党の得票率が伸びていない(基地移転問題?) 第1章 データ分析への招待 廣野元久 &高橋行雄

計数データの要約の例 (MA研究会(日科技連:休会)の研修での楽曲の対応分析) 調性 第1章 データ分析への招待 廣野元久 &高橋行雄

2.1 分析手法と理論 (続き) 分析の目的にあった手法が必ずある 研究目的の難易度と 手法の難易度は一致しない 2.1 分析手法と理論 (続き) 分析の目的にあった手法が必ずある 研究目的の難易度と 手法の難易度は一致しない 経済データやマーケットデータのアナリストは,定常的な分析ステップを持っている データマイニングのステップ 工場の技術者も改善ステップを持っている 品質管理のステップではQCストーリ 第1章 データ分析への招待 廣野元久 &高橋行雄

2.1 分析手法と理論 データをミスリードしないためには, 仮説の筋道に整合性があるか? データの背後にある背景の理解 2.1 分析手法と理論 データをミスリードしないためには, データの背後にある背景の理解 豊富な専門知識(文献調査も重要)とセンス 正しい分析方法の選択と分析理論の理解 データをグラフで表示し,論理的な推察を 仮説の筋道に整合性があるか? 他人に,筋道が理解できる 論理に矛盾や飛躍がないか データ分析は 論理学だ-ぁ 第1章 データ分析への招待 廣野元久 &高橋行雄

臨床試験での活用例 統計学のメジャーな応用分野の一つ 統計ガイドライン <ICH-E9> http://www.nihs.go.jp/dig/ich/eindex.html かなり難しいことが書いてある しかし、基本は、データ分析プロジェクトと同じ 臨床試験の進行に合わせてひも解くと良い 第1章 データ分析への招待 廣野元久 &高橋行雄

2.2 データ収集と研究計画 1/3 実験研究と観察研究では違う 主に観察研究の場合を学習しよう 2.2 データ収集と研究計画 1/3 実験研究と観察研究では違う 主に観察研究の場合を学習しよう 観察研究ではデータとその収集方法の知識が重要となる 第1章 データ分析への招待 廣野元久 &高橋行雄

2.2 データ収集と研究計画 2/3 すでにデータがある場合 (冷蔵庫の食材で料理を作る) データを集めて,どうしようではデータ分析できない 2.2 データ収集と研究計画 2/3 すでにデータがある場合 (冷蔵庫の食材で料理を作る) 自分の目的にふさわしいデータか (今日の献立に必要な食材を選び) データの素性に不確かなものはないか (腐ったり,鮮度の落ちた食材でないかチェック) データを集めて,どうしようではデータ分析できない (食材を並べて,いきなり調理はできない) 実社会では、これが一番多い 料理が苦手な人は食材ならべた途端 台所でパニくるって事ありませんか? 第1章 データ分析への招待 廣野元久 &高橋行雄

2.2 データ収集と研究計画 3/3 これからデータを収集する場合 (デパートの地下で食材を購入し,料理する) はじめに,見通しを立てる 2.2 データ収集と研究計画 3/3 これからデータを収集する場合 (デパートの地下で食材を購入し,料理する) はじめに,見通しを立てる (料理の献立を考える) 必要なデータは何か(不足情報はなにか) (必要な食材を洗い出す) データの収集(場所,測定するもの,測定者など) (買い出し) 第1章 データ分析への招待 廣野元久 &高橋行雄

臨床研究の方法(例) 第1章 データ分析への招待 廣野元久 &高橋行雄

2.3 対象分野の事前知識と判断力 ミスリードを察知する 前提情報が多いほど過ちを防ぐことができる プロといわれる人は,知識が豊富 素人は, まず事前情報や関連情報を集めてみる チュ-ボーですよ! では,お手本のシェフがいる 料理の本を参考にすれば,無駄な努力は減る 「データ分析入門」を参考に 星3つを目指そう 第1章 データ分析への招待 廣野元久 &高橋行雄

3.この教科書で学ぶこと 3.1事前知識と 使用するコンピュータソフトウエア 3.2学ぶ内容 3.3さらに深く学習するために      使用するコンピュータソフトウエア 3.2学ぶ内容 3.3さらに深く学習するために 第1章 データ分析への招待 廣野元久 &高橋行雄

3.1 事前知識と使用する コンピュータソフトウエア 1/2 3.1 事前知識と使用する コンピュータソフトウエア 1/2 データ分析の入門書(入り口) Windowsの基礎知識が必要 (操作できればよいレベル) JMP5Jを分析ツールとして利用する 教科書は,必ず購入する(版が変わる) PCは購入して欲しい(授業にPCは不可欠) 第1章 データ分析への招待 廣野元久 &高橋行雄

3.1 事前知識と使用する コンピュータソフトウエア 2/2 3.1 事前知識と使用する   コンピュータソフトウエア 2/2 データ分析の背後にある統計的な考え方,アプローチについて触れるが,直感的に理解できるように教科書は工夫されている  教科書(データ分析入門第5版)&JMP 5.1Jor5.0J 数学的知識は最小限 「データ分析入門」で,エッセンスを習得してから, 数理統計を学んでも遅くない 数理的内容は統計解析の入門書を参考にして! データ分析ツールを使い1本の報告書を作成する 第1章 データ分析への招待 廣野元久 &高橋行雄

3.2 本書の内容 (データ分析入門:慶応義塾大学出版) 3.2 本書の内容  (データ分析入門:慶応義塾大学出版) データ分析という作業全体の見通し 2章,3章&9章 必要なステージとその作業内容 データを視覚的に表現する ばらつきの活用 4章 視覚化の方法, 5章 JMPの導入 6章 JMPの操作 関連性の発見 8章,10章 2つの項目間の関連を調べる 11章,12章,13章,少し高度な方法 第1章 データ分析への招待 廣野元久 &高橋行雄

3.3 さらに深く学習するために JMPでできる多変量解析 ・主成分分析 ・対応分析 ・クラスター分析 ・判別分析 ・決定木(パーティション) ・重回帰分析 ・PLS ・ニューラルネット ・項目分析 ・非線形回帰分析 ・生存時間分析 ・時系列解析 第1章 データ分析への招待 廣野元久 &高橋行雄

臨床分野 1/2 http://www.nihs.go.jp/dig/ich/eindex.html 第1章 データ分析への招待 臨床分野 1/2 http://www.nihs.go.jp/dig/ich/eindex.html 第1章 データ分析への招待 廣野元久 &高橋行雄

臨床分野 2/2 第1章 データ分析への招待 廣野元久 &高橋行雄

4.データ分析プロジェクト 目的 プロセス(やりかた・感じかた) 道具 結果 データ分析を学ぶこと 1つのデータ分析プロジェクトを完成させること プロセス(やりかた・感じかた) 取り上げる内容は,自分の手におえる範囲で選ぶ 道具 JMP(統計ツール) Excel など 教室と友人の中にある  結果 素直にプロジェクトをすすめ,ふりかえりをおこなおう 自分の思い・考え・感じ方を論理的に伝える訓練 第1章 データ分析への招待 廣野元久 &高橋行雄