高次元データにおける2次形式の近似について 藤本 翔太 大阪大学基礎工学研究科修士課程前期1年 2010/02/19 日本分類学会2010@九州大学 1
概要 近年,様々な応用の場面で変数の次元が標本サイズよりも大きいデータ(高次元データ)が生じる DNA マイクロアレイデータ,気象データ,経時測定データ 変数の次元が数千のオーダ,標本サイズが数百のオーダ 従来の多変量解析は変数の次元が標本サイズよりも小さいデータを想定 高次元データを扱えない 高次元データに対応できる解析法が必要 本報告では,特に高次元データにおける1標本問題を扱う 先行研究:Dempster (1958,1960), Bai and Saranadasa (1996), Fujikoshi (2004), Srivastava (2007) 2010/02/19 日本分類学会2010@九州大学
従来の1標本問題とその問題点 2010/02/19 日本分類学会2010@九州大学
Dempster’s trace criterion 2010/02/19 日本分類学会2010@九州大学
条件(B) 2010/02/19 日本分類学会2010@九州大学
Srivastava (2007) の結果 \bm{Y}_{p}^{(i)}\stackrel{i.i.d.}{\sim}N_{p}(\bm{0},\bm{\Sigma}_{p}) 2010/02/19 日本分類学会2010@九州大学
Srivastava (2007) の結果 2010/02/19 日本分類学会2010@九州大学
本報告の主結果1 2010/02/19 日本分類学会2010@九州大学
Bai and Saranadasa(1996),Fujikoshi(2004)の結果 2010/02/19 日本分類学会2010@九州大学
本報告の主結果2 2010/02/19 日本分類学会2010@九州大学
本報告の主結果2 2010/02/19 日本分類学会2010@九州大学
本報告の主結果2 2010/02/19 日本分類学会2010@九州大学
2標本問題 2010/02/19 日本分類学会2010@九州大学
Monte Carlo Simulation 2010/02/19 日本分類学会2010@九州大学
Monte Carlo Simulation 2010/02/19 日本分類学会2010@九州大学
Monte Carlo Simulation 2010/02/19 日本分類学会2010@九州大学
まとめ 高次元データにおける1標本問題 Monte Carlo 実験の結果から 問題点と今後の課題 Dempster (1958, 1960) で提案された検定統計量が基本 先行研究の条件とは異なる条件を仮定 Srivastava (2007) の方法はそのまま使える Bai and Saranadasa (1996), Fujikoshi (2004) の方法は漸近分布が異なる Monte Carlo 実験の結果から 全体的にF-近似が良いパフォーマンス 間違えて正規分布で検定してもそこそこの数値 問題点と今後の課題 真の分散の構造が分かっていることが前提 平均の検定の前に分散の構造の検討が必要 分散の構造を仮定しない検定方法の提案が今後の課題 2010/02/19 日本分類学会2010@九州大学
参考文献 2010/02/19 日本分類学会2010@九州大学
おしまい ご清聴ありがとうございました 2010/02/19 日本分類学会2010@九州大学