データの分析 東京大学大学院 門田宏 時系列解析の応用 東京大学の門田です。 よろしくお願いします。

Slides:



Advertisements
Similar presentations
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
Advertisements

土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
相対論的場の理論における 散逸モードの微視的同定 斎藤陽平( KEK ) 共同研究者:藤井宏次、板倉数記、森松治.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
『モデリング・シミュレーション入門』 井庭 崇 第5回 オートマトン(状態機械)
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
再帰定量化解析による非線形時系列解析の手順
自己重力多体系の 1次元シミュレーション 物理学科4年 宇宙物理学研究室  丸山典宏.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
疫学概論 時系列研究 Lesson 11. 記述疫学 §B. 時系列研究 S.Harano,MD,PhD,MPH.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
復習.
補章 時系列モデル入門 ー 計量経済学 ー.
数値気象モデルCReSSの計算結果と 観測結果の比較および検討
10.時系列データの解析 time-series data
Excelによる統計分析のための ワークシート開発
エージェントモデル シミュレーション.
分布の非正規性を利用した行動遺伝モデル開発
Bassモデルにおける 最尤法を用いたパラメータ推定
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
時空間データからのオブジェクトベース知識発見
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
デジタル信号処理①
大阪工業大学 情報科学部 情報システム学科 宇宙物理研究室 B 木村悠哉
【第三講義】 1次元写像の軌道と安定性.
酒井哲郎:海岸工学入門,森北出版 第3章(pp.27-36)
流体のラグランジアンカオスとカオス混合 1.ラグランジアンカオス 定常流や時間周期流のような層流の下での流体の微小部分のカオス的運動
統計リテラシー育成のための数学の指導方法に関する実践的研究
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
セッション3:最近のミスマッチの実例分析 実例2:地震予知 地震予知情報発信のされ方について 予知研究の現場から
補章 時系列モデル入門 ー 計量経済学 ー.
脳活動に関するデータ データの種類 データの特徴 脳波・脳磁図・fMRI画像 脳活動とパフォーマンスの関係はきわめて冗長。
計測工学 復習.
Lorenz modelにおける 挙動とそのカオス性
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
ガウス過程による回帰 Gaussian Process Regression GPR
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
自動車用オートマティックトランスミッションの異常診断への応用
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
弓射への力学的アプローチ(その7) 赤門支部 鈴木千輝
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
あらまし アンサンブル学習の大きな特徴として,多数決などで生徒を組み合わせることにより,単一の生徒では表現できない入出力関係を実現できることがあげられる.その意味で,教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い.そこで本研究では,教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する.メトロポリス法により汎化誤差を計算した結果,ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること,パーセプトロン学習では
細胞の形と変形のための データ駆動型解析手法
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
カオス水車のシミュレーションと その現象解析
予測に用いる数学 2004/05/07 ide.
心理実験における データ分析 Q&A 平成15年12月3日(水) スポーツ心理学会第30回大会 ラウンドテーブルディスカッション
(昨年度のオープンコースウェア) 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
Data Clustering: A Review
バリオン音響振動で探る ダークエネルギー ~非線形成長と赤方偏移歪みの影響~
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
シミュレーション論 Ⅱ 第1回.
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
ナイキストの安定判別に基づく熱音響システムの自励発振解析における発振余裕と 定常発振状態における圧力振幅の関係
HMM音声合成における 変分ベイズ法に基づく線形回帰
Daniel Roelke, Sarah Augustine, and Yesim Buyukates
【第六講義】非線形微分方程式.
回帰分析入門 経済データ解析 2011年度.
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
疫学概論 時系列研究 Lesson 11. 記述疫学 §B. 時系列研究 S.Harano,MD,PhD,MPH.
教師がコミティマシンの場合のアンサンブル学習 三好 誠司(神戸高専) 原 一之(都立高専) 岡田 真人(東大,理研,さきがけ)
中性子星/ブラックホール連星の光度曲線の類似性
Presentation transcript:

データの分析 東京大学大学院 門田宏 時系列解析の応用 東京大学の門田です。 よろしくお願いします。

実験手法による現象の理解 計測 (調査、観察、観測、測定、、、、) 分析 (統計、時系列解析、、) 発見 (データマイニング、、、) 計測 (調査、観察、観測、測定、、、、) 分析 (統計、時系列解析、、) 発見 (データマイニング、、、) 解釈 (モデリング、、、) 応用 (予測、制御、、、)

静的な性質 実験→数値データ k次統計モーメント 平均(一次のモーメント) 分散(二次のモーメント) →統計的仮説検定を行ない、 母集団の推定 (統計的推定) 静的な性質 (時間的要素を考慮しない) k次統計モーメント p(x):確率、μ:期待値 k次統計モーメント 3次 歪度 歪み具合 4次 尖度(せんど) とんがり具合

σ=1 平均=0 静的には同じ性質 2つの時系列データ 同じ? →時間を考慮して数値データを考える必要。

動的な性質 動的な性質 (時系列解析) 相関 (時間的表現)   時刻tにおける値x(t)とτだけ離れた時刻t+τの値x(t+τ)がどれぐらい似ているのか? スペクトル (周波数的表現)   データがどのような波の成分を持っているのか? (ウィーナーヒンチンの定理) μ=平均 <>は集合平均 パワースペクトルと自己相関の関係 相関 スペクトル 逆フーリエ変換 フーリエ変換

変動に見られる構造 各要素の占める割合 複数の要素が相互作用すること によって形成される場合 →変動自体に何らかの構造を持つ。 状態0状態1 状態2状態3 各要素の占める割合 複数の要素が相互作用すること によって形成される場合 →変動自体に何らかの構造を持つ。   変動はシステムのダイナミクスを反映する大切な量。 →時系列全体の構造の解明。 t 変動=ゆらぎはシステムのダイナミクスを反映する大切な量であり、単なる平均値のまわりの偶然の誤差ではない。 雪崩の自己組織化臨界現象 時間経過に伴う形成過程

時系列解析 全体の構造を捉える フラクタル 大きなスケールでも 小さなスケールでも 同じような構造が見える性質 ↓ 幾何学的にデータ全体の 時系列解析    全体の構造を捉える フラクタル   大きなスケールでも   小さなスケールでも 同じような構造が見える性質 ↓   幾何学的にデータ全体の   構造を調べる。 カオス フラクタル 大きなスケールでも小さなスケールでも同じような構造が見える性質 似た形を持った、たくさんの違った大きさの構造を持つものの集まりという意味 自分自身が自分自身の相似図形で成り立っているものをフラクタル図形という <フラクタルの定義>ハウスドルフ-ベシコビッチ次元が、トポロジカルな次元より大きくなる集合である。

フラクタル構造 P∝1/f α α≒直線の傾き データの一部を取り出し、 拡大すると元のデータと同じ性質を持つ。 Log PSD Log Frequency 周波数とパワースペクトル (波の周期とその波の大きさの2乗)を 両対数表示すると直線になる。 スケーリング解析 αスケーリング指数 P∝1/f α α≒直線の傾き データの一部を取り出し、 拡大すると元のデータと同じ性質を持つ。

長期記憶 例えばα=0.8、ラグτ=1秒の場合、 自己相関関数の値を10%以下に落とすには 105 秒もの時間を必要とする。 P∝1/f α Log PSD Log Frequency 例えばα=0.8、ラグτ=1秒の場合、 自己相関関数の値を10%以下に落とすには 105 秒もの時間を必要とする。 αが0より大きい場合、自己相関が緩やかに減衰し、非常に長期の時間相関を持つ。 α=0のとき、ホワイトノイズと呼ばれ、時系列は時間相関を持たない。 時間相関が強いほどαの値が大きくなる。 αの値によって時系列の不規則さ、複雑さを定量化できる。 相関なし 自己相関関数τ^(β-1) 長期相関

長期記憶解析 Hurst:ナイル川の水位の記録 における長期記憶解析 (Rescaled range (R/S) analysis) スペクトル解析 (Mandelbrot) Detrended fractuation analysis などなど。 その他にもたくさんの分析方法が存在します。 統計量の相似性;ガウス分布に従い、平均=0、時系列データの分散の差var(B(t)-B(s))=σ^2|t-s| 同じような複雑さをもった形に見える、統計的な意味で自己相似性

運動にみられる長期相関 (例1) など →(主に)連続的な動きに存在する変動の多くは長期記憶を持つ。 歩行間隔 (Hausdorff et al., 1995) リズム動作 (Yamada, 1995) タイミング同期動作 (Chen et al., 1997) 姿勢動揺 (Collins and Deluca, 1993) 心拍変動 (Yamamoto and Hughson, 1994)   など   →(主に)連続的な動きに存在する変動の多くは長期記憶を持つ。 加齢や病気、障害、(外部刺激に対する)とらえ方などによってこれらの時間構造は変化する。

ヒトの時間認知および 運動実行系における時間構造 (例2) ヒトの時間認知および 運動実行系における時間構造 (例2) 一定間隔で刺激が提示される場合   ●刺激間隔が短く予測できる   →長期相関を持つ。   ●刺激間隔が長く、予測できない   →時間相関を持たない。  (Gilden et al., 1995;      Shelhamer and Joiner, 2003) ヒトの運動実行系および認知系(内部時計)における時間構造のモデル化 (Gilden et al., 1995)

標的到達動作課題における時間特性 (例3) discrete動作における時間構造 間欠的標的到達動作課題   (Miyazaki et al., 2001) 動作初期のキネマティクス →長期の時間相関が存在。 動作終着点   →時間相関が無くなる。 ヒトの運動遂行時における調整過程

マルチフラクタル (例4) (異なるフラクタル次元が分布している集合) 心拍変動に対してマルチフラクタル解析 (Ivanov et al., 1999) Healthy:マルチフラクタル、   Heart failure:モノフラクタル 解析が診断に使える可能性。 これまでに見つかっていない、現象や状態の発見につながる可能性。 心拍うっ血性心不全

数値データの構造の解析2 力学的アプローチ 状態空間 力学系   状態をいくつかの変数で記述する。 力学系 力学系は状態空間と状態の変化を決める規則で決められる。状態空間の中での時間変化に伴う軌跡で描かれる。 体重 身長

カオス(決定論的な系が作り出す予測不可能な振る舞い) カオスの特徴 状態空間で表現した場合、限られた領域内に   収まる(アトラクタ)。 アトラクタから、時系列データの特徴をとらえる事ができる。 長期的な予測は不可能、短期的な予測は可能   →非線形予測 ●軌道不安定性→リアプノフ指数で定量化 ●長期予測不能性(短期予測は可能)  →決定論的非線形予測 ●有界性 ●アトラクタのフラクタル性、自己相似性 ●非周期性(軌道は2度と同じ点に戻ることは無い) ロジスティック写像

動作分析Ⅰ(例1) 指の周期運動 x t リミットサイクルと呼ばれる 周期運動(Kay et al., 1991) リミットサイクル:初期条件に依存せず、また外乱が 加えられても再び安定した振る舞いを示す。

動作分析Ⅱ (例2) テニスのフォアハンドおよびバックハンドストロークの繰り返し連続動作 (Yamamoto and Gohara, 2000)。 肩、腰の角度変化 回転のあるカントール集合として考えることができる。 F(フォア) B(バック) FBFと来た時の角度 BFFと来た時の角度 カントール集合:中央部の1/3を抜き取るという操作を繰り返すことによって得られる。

カオス制御(OGY法) (例3) ④’ ② ③ ④ OGY(Ott-Grebogi-Yorke)法 平衡点近傍での不安定軌道に制御信号を 印加する事により安定軌道に漸近させる ① ウサギの不整脈の制御 (Garfinkel et al., 1992; 野崎大地, 山本義春, カオス研究の最前線, 生理学とカオス) ウサギの不整脈の状態空間上での振る舞いを調べ、振る舞いの予測を行なう。 不安定な状態の場合、電気刺激をして安定状態へ落ち着かせる。 不整脈を規則的な拍動に制御することに成功。

非線形予測 (例4) Sugihara and May(1990) 非線形予測の利用 新生児に見られる自発的運動 (ジェネラルムーブメント)  (多賀厳太郎, 脳と身体の動的デザイン)  カオス力学系のような振舞いをする。 発達に伴う予測指標の変化      複雑→単純→複雑 脳に障害がある場合  PVL→高い予測、脳梗塞→低い予測 GMの定量化、発達過程や脳障害のパターン変化を明らかにできる。 PVL(periventricular leukomalacia )脳室周囲白質軟化症 非線形予測(Sugihara and May) 動径基底関数ネットワークや多数パーセプトロン(ニューラルネットワーク)のように、多数のモデルパラメータを最適化することを必要としない。

まとめ フラクタル、カオスなどの非線形力学系がもたらしたもの 物事を如何にとらえるか 自然、生命の構造を記述する理論の構築 時系列解析   物事を如何にとらえるか   自然、生命の構造を記述する理論の構築 時系列解析   ●現象の発見   ●新たな概念の導入、理論の構築   ●状態の把握、診断、分類   ●非線形予測、制御 物事に対する新たな見方を与えたこれまで考えられなかった、現象の発見。 現象を説明する新たな概念、理論の導入。 時系列解析を利用した状態の把握、診断、分類 さらには非線形予測やカオス制御のような応用が考えられます。

参考 山本義春先生のホームページ http://www.p.u-tokyo.ac.jp/~yamamoto/ 利用可能なパッケージ(実際に使ったことはないので詳細については不明) FFT http://momonga.t.u-tokyo.ac.jp/~ooura/fftman/index.html   Fractal Analysis Programs http://nsr.bioeng.washington.edu/Software/NSR_SW_fractal.html http://reylab.bidmc.harvard.edu http://nsr.bioeng.washington.edu/PLN ソフト http://www.aihara.co.jp/rdteam/sunday-chaostimes/index-j.html 参考文献 時系列解析入門 (宮野尚哉) サイエンス社 非線形時系列解析 (松葉育雄) 朝倉書店 カオス時系列解析の基礎と応用 (合原一幸 編) 産業図書 カオス (合原一幸 編著) サイエンス社 フラクタル幾何学 (Mandelblot) 日経サイエンス社 生命とは何か (金子邦彦) 東京大学出版会 最後に参考文献