高次元データにおける2次形式の近似について

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
新設科目:応用数学 イントロダクション 情報工学科 2 年前期 専門科目 担当:准教授 青木義満.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
Rコマンダーで反復測定ANOVA.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
分散分析マスターへの道.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
第5回(5/10) 授業の学習目標 1.1.5節 検定の前提とその適否について考えよう(テキスト輪読 p.10から p.11)
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
生物統計学・第3回 全体を眺める(2) 主成分分析
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
統計解析 第10回 12章 標本抽出、13章 標本分布.
1時限で理解する 統計の基礎 応用情報処理II 2015/12/4 講師:新居雅行.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
高次元データにおける幾つかの検定統計量の漸近分布について
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
赤道QBOの影響の統計的有意性 ― 大標本法に基づいた評価 ―
ガウス過程による回帰 Gaussian Process Regression GPR
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
応用数理工学特論 期末発表 西口健太郎 渡邉崇充
相関分析.
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
心理実験における データ分析 Q&A 平成15年12月3日(水) スポーツ心理学会第30回大会 ラウンドテーブルディスカッション
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1.母平均の検定:小標本場合 2.母集団平均の差の検定
背景 課題 目的 手法 作業 期待 成果 有限体積法による汎用CFDにおける 流体構造連成解析ソルバーの計算効率の検証
文書分類モデルの統計的性質に関する一考察
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
不完全な定点観測から 真の不正ホストの分布が分かるか?
第4章 統計的検定 (その2) 統計学 2006年度.
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
藤本翔太1, 狩野裕1, Muni.S.Srivastava2 1大阪大学基礎工学研究科
停止ストリームの検知(2).
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
GbEにおける TCP/IP の研究について
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
Jan 2015 Speaker: Kazuhiro Inaba
2008年 電気学会 全国大会 平成20年3月19日 福岡工業大学 放電基礎(1)
弱電離気体プラズマの解析(LXXVI) スプラインとHigher Order Samplingを用いた 電子エネルギー分布のサンプリング
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

高次元データにおける2次形式の近似について 藤本 翔太 大阪大学基礎工学研究科修士課程前期1年 2010/02/19 日本分類学会2010@九州大学 1

概要 近年,様々な応用の場面で変数の次元が標本サイズよりも大きいデータ(高次元データ)が生じる DNA マイクロアレイデータ,気象データ,経時測定データ 変数の次元が数千のオーダ,標本サイズが数百のオーダ 従来の多変量解析は変数の次元が標本サイズよりも小さいデータを想定 高次元データを扱えない 高次元データに対応できる解析法が必要 本報告では,特に高次元データにおける1標本問題を扱う 先行研究:Dempster (1958,1960), Bai and Saranadasa (1996), Fujikoshi (2004), Srivastava (2007) 2010/02/19 日本分類学会2010@九州大学

従来の1標本問題とその問題点 2010/02/19 日本分類学会2010@九州大学

Dempster’s trace criterion 2010/02/19 日本分類学会2010@九州大学

条件(B) 2010/02/19 日本分類学会2010@九州大学

Srivastava (2007) の結果 \bm{Y}_{p}^{(i)}\stackrel{i.i.d.}{\sim}N_{p}(\bm{0},\bm{\Sigma}_{p}) 2010/02/19 日本分類学会2010@九州大学

Srivastava (2007) の結果 2010/02/19 日本分類学会2010@九州大学

本報告の主結果1 2010/02/19 日本分類学会2010@九州大学

Bai and Saranadasa(1996),Fujikoshi(2004)の結果 2010/02/19 日本分類学会2010@九州大学

本報告の主結果2 2010/02/19 日本分類学会2010@九州大学

本報告の主結果2 2010/02/19 日本分類学会2010@九州大学

本報告の主結果2 2010/02/19 日本分類学会2010@九州大学

2標本問題 2010/02/19 日本分類学会2010@九州大学

Monte Carlo Simulation 2010/02/19 日本分類学会2010@九州大学

Monte Carlo Simulation 2010/02/19 日本分類学会2010@九州大学

Monte Carlo Simulation 2010/02/19 日本分類学会2010@九州大学

まとめ 高次元データにおける1標本問題 Monte Carlo 実験の結果から 問題点と今後の課題 Dempster (1958, 1960) で提案された検定統計量が基本 先行研究の条件とは異なる条件を仮定 Srivastava (2007) の方法はそのまま使える Bai and Saranadasa (1996), Fujikoshi (2004) の方法は漸近分布が異なる Monte Carlo 実験の結果から 全体的にF-近似が良いパフォーマンス 間違えて正規分布で検定してもそこそこの数値 問題点と今後の課題 真の分散の構造が分かっていることが前提 平均の検定の前に分散の構造の検討が必要 分散の構造を仮定しない検定方法の提案が今後の課題 2010/02/19 日本分類学会2010@九州大学

参考文献 2010/02/19 日本分類学会2010@九州大学

おしまい ご清聴ありがとうございました 2010/02/19 日本分類学会2010@九州大学