データ解析 http://coconut.sys.eng.shizuoka.ac.jp/data/ 静岡大学工学部 安藤和敏 2005.10.19.

Slides:



Advertisements
Similar presentations
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
Advertisements

統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
グラフィカル多変量解析 ----目で見る共分散構造分析----
データ解析
EXCELで学ぶマーケティング統計 第4章 経営学研究科 M1  真島 健.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
重回帰分析入門 経済データ解析 2009年度.
データ解析 静岡大学工学部 安藤和敏
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
数個、数十個のデータ点から その特徴をつかむ
一次関数のグラフ(式を求めること) 本時の流れ ねらい「グラフや座標など与えられた条件をもとに一次 関数の式を求める。」 ↓
3 一次関数 1章 一次関数とグラフ §3 一次関数の式を求めること          (3時間).
重回帰分析入門 経済データ解析 2011年度.
回帰分析.
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
回帰分析/多変量分析 1月18日.
誤差の二乗和の一次導関数 偏微分.
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
構造方程式モデリング(SEM) Structural Equation Modeling.
補章 時系列モデル入門 ー 計量経済学 ー.
プロセスデータ解析学2 -単回帰分析- 担当:長谷部伸治     金 尚弘.
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 カーネル法 修士2年 藤井 敬士.
相関分析.
市場規模の予測.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
第9章 混合モデルとEM 修士2年 北川直樹.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
データ解析 静岡大学工学部 安藤和敏
最小自乗法.
東京工科大学 コンピュータサイエンス学部 亀田弘之
市場規模の予測.
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
データ構造とアルゴリズム 第11回 リスト構造(1)
第3章 線形回帰モデル 修士1年 山田 孝太郎.
データ解析 静岡大学工学部 安藤和敏
データ解析 静岡大学工学部 安藤和敏
サポートベクターマシン Support Vector Machine SVM
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
データ解析 静岡大学工学部 安藤和敏
相関分析 2次元データと散布図 共分散 相関係数.
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
リッジ回帰(Ridge Regression, RR) Least Absolute Shrinkage and Selection Operator (LASSO) Elastic Net (EN) 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
構造方程式ゼミナール 2012年11月14日-11月21日 構造方程式モデルの作成.
重回帰分析入門 (第5章補足) 統計学 2007年度.
回帰分析入門 経済データ解析 2011年度.
3 一次関数 1章 一次関数とグラフ §4 方程式とグラフ         (3時間).
7.2 回帰曲線 身長と体重…関係がありそう? ??? 身長と体重の関係をグラフで観察する.
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

データ解析 http://coconut.sys.eng.shizuoka.ac.jp/data/ 静岡大学工学部 安藤和敏 2005.10.19

1-4 関係,原因・結果をイメージにするパス図 多変量解析におけるモデルを直感的に理解するための図

ある会社の社員のデータ 社員No 社交性 勤勉性 企画力 判断力 給与評価 1 7 6 8 10 2 4 5 3

パス図 勤勉性 誤差 給与評価 企画力 データに現れる変数(観測変数)を四角で囲む. 変数間の因果関係を矢線で示す. 誤差を丸で囲む.

潜在変数を含むパス図 協調能力 専門能力 社交性 勤勉性 給与評価 企画力 判断力 誤差 誤差 誤差 誤差 誤差 データに現れない変数をモデルに組み込むことがある. そのような変数を潜在変数と呼んで,楕円で囲む.

潜在変数を含むパス図 0.36 0.71 協調能力 専門能力 社交性 勤勉性 給与評価 企画力 判断力 誤差 誤差 誤差 誤差 誤差 楕円の横にその変数の分散書き込むことがある.(分散はその変数の持つ情報量をあらわすということを先週述べた.)

潜在変数を含むパス図 -0.04 0.36 0.71 協調能力 専門能力 社交性 勤勉性 給与評価 企画力 判断力 誤差 誤差 誤差 誤差 両矢印の上には共分散を記入することもある.

潜在変数を含むパス図 -0.04 0.36 0.71 協調能力 専門能力 1.79 社交性 勤勉性 給与評価 企画力 判断力 誤差 誤差 影響の強さは,矢線の上につけた数値で表現する.この数値をパス係数と呼ぶ.

パス図のまとめ ・・・・・・・ 観測変数 ・・・・・・・ 潜在変数 ・・・・・・・ 誤差 ・・・・・・・ 因果関係 ・・・・・・・ 関連

第2章 Excelで学ぶ重回帰分析 単回帰分析 重回帰分析

重回帰分析 浜松駅周辺の中古マンションのデータ

重回帰分析によってわかること 価格は,広さと築年数によってどのように予測できるか. 予測できるとすれば, その精度はどれくらいか. 同じ地区で広さ70m2, 築年数10年, 価格5.8千万円のマンションを提示された. この価格は妥当か. 価格と広さと築年数は以下の関係にあると推定される.     価格 = 1.02 + 0.0668 ×広さ - 0.0808 ×築年数 2. 寄与率は 0.933 で上式の精度は十分高い. 3. 広さ=70, 築年数=10を代入すると, 価格=4.89となるので, 5.8千万円は相場より高い.

2-1 1変数を1変数から予測する単回帰分析 単回帰分析は重回帰分析の最も単純な特別な場合. 重回帰分析の理解のための基礎となる.

単回帰分析のデータ

散布図

直線のあてはめ(1)

直線のあてはめ(2)

直線のあてはめ(3)

単回帰分析の目的(の一つ) 与えられたデータに「最もよくあてはまる」直線 を求めること. 「最もよくあてはまる直線」ってどういうこと? 回帰方程式 を求めること. 目的変数 切片 単回帰係数 説明変数 「最もよくあてはまる直線」ってどういうこと?

単回帰分析のデータ 個体番号 変数 x 変数 y 1 x1 y1 2 x2 y2 … i xi yi n xn yn

残差

残差平方和 Qを a と b を変数にもつ2変数関数として見て,Q(a,b)を最小にする a と b が,データに「最もよくあてはまる」直線を与えると考える. このようにしてa と b を求める方法を最小2乗法と呼ぶ. どのようにしてQ(a,b)を最小にする a と bをもとめるのかを見ていく.

一般に多変数関数の極値(最大値,最小値)を求めるには,各変数で偏微分して0と置いた方程式系を解けばよい

連立方程式を解く(1)

連立方程式を解く(2)

連立方程式を解く(3)

連立方程式の解

単回帰分析のパス図 ε x y

本日のまとめ パス図の読み方,書き方を理解した. 回帰分析に関わる用語:回帰方程式,説明変数,目的変数,などを理解した. 最小2乗法の考え方,及び,回帰方程式の求め方を理解した. Excelを用いて単回帰分析を行う方法を理解した.