データ解析 http://coconut.sys.eng.shizuoka.ac.jp/data/ 静岡大学工学部 安藤和敏 2005.10.05.

Slides:



Advertisements
Similar presentations
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
Advertisements

統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
新設科目:応用数学 イントロダクション 情報工学科 2 年前期 専門科目 担当:准教授 青木義満.
EExcelに入っている便利な分析ツールや統計手法を学び 研究する。具体的には、第1章では、意志決定及びモデリン グの考え方・位置付けについて研究する。意志決定ツール( モデル)から何を得ることができ、何を自分で決めなくては ならないのかについて研究する。「平均的による分析」の限 界、データ分析とリスクとの関係についても研究する。第2.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
主成分分析 主成分分析は 多くの変数の中を軸を取り直すことで より低い次元で表現できるようにする。 データがばらついている方向ほど
データ解析
データ分析入門(12) 第12章 単回帰分析 廣野元久.
因子分析,共分散構造分析 Factor Analysis Structural Equations Model
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
重回帰分析入門 経済データ解析 2009年度.
データ解析 静岡大学工学部 安藤和敏
実証分析の手順 経済データ解析 2011年度.
大学院に向けての学習の進め方 〔注意〕 *この資料は、「このとおり学習すれば合格する」と保証するものではありません。 *筆記試験以外に「面接試験」があります。「筆記試験の成績さえ良ければ合格する」ということではありません。 *「ここに掲載しているテキストから試験問題が出題される」という意味ではありません。
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第5回(5/10) 授業の学習目標 1.1.5節 検定の前提とその適否について考えよう(テキスト輪読 p.10から p.11)
林俊克&廣野元久「多変量データの活用術」:海文堂
生物統計学・第3回 全体を眺める(2) 主成分分析
重回帰分析入門 経済データ解析 2011年度.
マーケティング・リサーチ オリエンテーション.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
回帰分析.
情報数理Ⅱ 平成27年9月30日 森田 彦.
第6章 数量化I類.
データ分析入門(13) 第13章 主成分分析 廣野元久.
主成分分析                     結城  隆   .
12月4日 伊藤 早紀 重回帰分析.
回帰分析/多変量分析 1月18日.
ワークショップ ユーザーとメーカーの公開相談会
マーケティング 第2部 マーケティング・リサーチ
環境計画数理 佐野可寸志 オフィスアワー 木曜昼休み.
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
統計学の基礎と応用 張 南   今日の話:序   論          履修の注意事項.
2010/04/8 情報システム学科 情報システム演習1 担当:小宮山智志
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
シミュレーション論 Ⅱ 第15回 まとめ.
相関分析.
データ解析 静岡大学工学部 安藤和敏
市場規模の予測.
主成分分析 (Principle Component Analysis)
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
最小自乗法.
近代金融論 前田拓生.
多変量解析ゼミ 第10回 第12章クラスター分析 発表者 直江 宗紀.
予測に用いる数学 2004/05/07 ide.
主成分分析 Principal Component Analysis PCA
講義を行うにあたっての注意 講義は静かに行いたい 出席は取らない(自由に休んでよろしい) 大学と高校の違い 人や先生に聞く・質問すること
東京工科大学 コンピュータサイエンス学部 亀田弘之
プログラミング論 主成分分析
市場規模の予測.
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
分散分析、判別分析、因子分析.
プロセスデータ解析学5 -主成分分析- 担当:長谷部伸治     金 尚弘.
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
講義を行うにあたっての注意 講義は静かに行いたい 出席は取らない(自由に休んでよろしい) 大学と高校の違い 人や先生に聞く・質問すること
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
データ構造とアルゴリズム 第11回 リスト構造(1)
データ解析 静岡大学工学部 安藤和敏
データ解析 静岡大学工学部 安藤和敏
データ解析 静岡大学工学部 安藤和敏
データ解析 静岡大学工学部 安藤和敏
重回帰分析入門 経済データ解析 2008年度.
情報数理Ⅱ 平成28年9月21日 森田 彦.
回帰分析入門 経済データ解析 2011年度.
平成22年度    計 量 心 理 学  a.
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
地域と金融 前田拓生.
Presentation transcript:

データ解析 http://coconut.sys.eng.shizuoka.ac.jp/data/ 静岡大学工学部 安藤和敏 2005.10.05

本講義の内容 本講義では,多変量解析について学ぶ. 多変量解析は多変量データを解析するためのいろいろな手法の寄せ集めである. それらの手法のうちで主なものに, 回帰分析法 主成分分析法 因子分析法 判別分析法 がある.本講義においては, これらの手法について学ぶ予定である.

多変量データの例(1) あるコンサルタント会社の社員10人についてのデータ

多変量データの例(2) 浜松駅周辺の中古マンションのデータ

多変量データ いくつかの変数をもつデータの集まり

重回帰分析 浜松駅周辺の中古マンションのデータ

重回帰分析によってわかること 価格は,広さと築年数によってどのように予測できるか. 予測できるとすれば, その精度はどれくらいか. 同じ地区で広さ70m2, 築年数10年, 価格5.8千万円のマンションを提示された. この価格は妥当か. 価格と広さと築年数は以下の関係にあると推定される.     価格 = 1.02 + 0.0668 ×広さ - 0.0808 ×築年数 2. 寄与率は 0.933 で上式の精度は十分高い. 3. 広さ=70, 築年数=10を代入すると, 価格=4.89となるので, 5.8千万円は相場より高い.

判別分析 検査値のデータ

判別分析によってわかること 疾病にかかっているか否かを検査値1と検査値2から判別できるか. 判別できるとすれば, その精度はどれくらいか. 例えば, 検査値1=70, 検査値2=19.0ならどのように判別されるか. 判別式 Z = -8.843+0.158×検査値1   が求まって, Z≧0ならば健常者, Z<0なら患者と判別する. 2. 本当は健常者なのに患者と誤判別する確率は0.1075, 本当は患者なのに 3. 健常者と誤判別する確率も0.1075. 4. Z = -8.843+0.158×検査値1に,検査値1=70 を代入するとZ ≧ 0$となるので, 健常者と判別される.

主成分分析 試験の成績のデータ

主成分分析によってわかること 各科目の点数を総合することによって,より少ない変数(主成分と呼ばれる)で表現できないか. 各主成分は,どのように解釈できるか? 主要な主成分として第1主成分z1と第2主成分z2を得る.  z1 = 0.487 ×国語+ 0.511×英語 + 0.508 ×数学      + 0.493 ×理科  z2 = 0.527 ×国語+ 0.474 ×英語 - 0.481 ×数学      - 0.516 ×理科 2. 係数の値より, z1は「総合的学力」を, z2は 「理系と文系の学力の違い」を表すと解釈できる.

主成分分析のイメージ 国語 数学 英語 理科 総合的学力 理系学力

因子分析 試験の成績のデータ

因子分析によってわかること 各科目の点数を,1つあるいは,それ以上の共通した原因,(例えば,学力,理系的能力など)によって,表現できないか. これらの共通の原因は因子と呼ばれる. これらの因子は,どのように解釈できるか?

因子分析のイメージ 因子1 因子2 国語 数学 英語 理科

教科書と参考書 教科書 涌井良幸,涌井貞美「Excelで学ぶ多変量解析」ナツメ社, 2005年. 参考書   永田靖, 棟近雅彦「多変量解析法入門」サイエンス社, 2001年.   田中豊, 脇本和昌: 多変量統計解析法. 現代数学社, 1983年.

この講義の履修に関する注意 出席は取らない.ただし,指名して答えてもらうことがある. 私語禁止(真面目に講義を聞いている人の邪魔をしてはいけない.あまりにひどい場合は,退室を命ずる.減点の対象するので名前を教えてもらう.) 爆睡,内職禁止(講義に出る意味がないし,教員に対して失礼.減点の対象とするので,名前を教えてもらう.) 教科書とMicrosoft ExcelがインストールされているノートPCを次回は持参してくること.