過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景

Slides:



Advertisements
Similar presentations
顔表情クラスタリングによる 映像コンテンツへのタギング
Advertisements

点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
重回帰分析入門 経済データ解析 2009年度.
ニューラルネットのモデル選択 村田研究室 4年  1G06Q117-5 園田 翔.
重回帰分析入門 経済データ解析 2011年度.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
Bias2 - Variance - Noise 分解
Bias2 - Variance - Noise 分解
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
固定カメラ映像からの音声情報を 用いた映像コンテンツ生成
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
Buried Markov Modelを用いた 構音障害者の音声認識の検討
非負値行列因子分解による 構音障害者の声質変換
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
視点移動カメラにおけるカメラキャリブレーション
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
1-P-6 パラボラ反射板を用いたアクティブマイクロフォンによる方向推定
Specmurtを利用した調波構造行列による 混合楽音解析の検討
主成分分析 Principal Component Analysis PCA
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
人物の顔情報に基づくコンテンツの解析 岡田朋子 滝口哲也 有木康雄 神戸大学 …という題目で神戸大学の岡田が発表致します。
2つの平行光の観測による 内部カメラパラメータの安定なキャリブレーション
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
第3章補足2 多変量データの記述 統計学基礎 2010年度.
Number of random matrices
各会話シーン毎に、発話(音源)方向を推定
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
Stepwise (ステップワイズ) 法による 説明変数 (入力変数・記述子・ 特徴量) の選択
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
HMM音声合成における 変分ベイズ法に基づく線形回帰
距離空間ピラミッドを用いた LLCによる3次元物体認識
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
ベイズ音声合成における 事前分布とモデル構造の話者間共有
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
尤度最大化基準を用いたエコー推定に基づく 車室内音響エコーキャンセラの検討
音響特徴量を用いた自閉症児と定型発達児の識別
重回帰分析入門 経済データ解析 2008年度.
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
AAMと回帰分析による視線、顔方向同時推定
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
ランダムプロジェクションを用いた音響モデルの線形変換
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景 高谷 学 滝口 哲也 有木 康雄(神戸大学) 顔・視線同時推定 研究背景 ◆顔方向推定誤差の影響 ◆AAMによる顔・視線方向の同時推定 ◆モデル選択手法による過学習の緩和 ◆視線は人間の意図や興味を表す情報 ◆単眼カメラによる視線推定技術への期待  ・AAMによる顔・視線方向のモデル化  ・AAMのパラメータを回帰分析  ・ロボットビジョン  ・顔方向推定誤差の緩和  ・インターフェース  ・不要な次元による過学習  ・マーケティング 非接触・低侵襲の単眼カメラによる 視線推定技術  ・回帰分析に用いる不要な説明変数の削減  ・赤池情報量規準(AIC)、ベイズ情報量規準(BIC)、最小記述長規準(MDL)など AAMによる顔・視線同時推定 ◆顔・視線方向の変化をモデル化 ◆combinedパラメータを回帰分析 モデル選択による過学習の緩和  ・顔・視線方向の変化に伴う、顔の形状、テクスチャを同時にモデル化 ◆不要な次元の削減の必要性 ◆様々なモデル選択の手法  ・顔・視線方向の変化を表さない次元が過学習の原因  ・モデル選択の手法を用いて不要な次元を削減 yk:目的変数 xi:説明変数 f:k番目のモデルにおいて、i番目の説明変数を用いるかを選択する変数 s:形状ベクトル g:テクスチャベクトル Ps,Pg,Qs,Qg,:直交空間  ・回帰式の汎化能力を学習データを用いて評価 Ws:単位を揃えるための変換行列  ・赤池情報量規準(AIC) パラメータを変化と モデルの変化 c:combinedパラメータベクトル k:回帰式の自由度(説明変数の数) L:モデルの最大尤度  ・最小記述長規準(MDL) n:学習データの数  ・ベイズ情報量規準(BIC) φ:顔方向角度 a0:定数係数ベクトル θ:視線方向角度 A:係数行列 評価実験と考察 ◆実験データ ◆実験結果 ◆考察とまとめ  ・被験者4名  ・顔、視線方向左右20度以内の顔画像  ・表情は全て無表情  ・学習画像63[枚/人]、テスト画像[252枚/人]  ・石川らの手法を従来手法として比較  ・主にモデル選択を行ったため精度が改善した  ・AAMが未学習人物に対して、特徴量を追跡できない問題への対応  ・推定に必要な計算時間の問題への対応