Building text features for object image classification

Slides:



Advertisements
Similar presentations
生体情報を利用したオンライン認証システムに関する研 究 情報工学科 大山・山口・小尾研究室 学士課程4年田中 丈登.
Advertisements

CV-Reading Describing Objects by their Attributes 山内悠嗣.
Learning Appearance in Virtual Scenarios for Pedestrian Detection
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
パネル型クエリ生成インタフェース画像検索システムの改良
リアルタイム単語認識技術を利用した カメラベース情報取得システム
Pose Tracking from Natural Features on Mobile Phones
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
芦田尚美*,髙田雅美*,木目沢司†,城和貴* *奈良女子大学大学院 †国立国会図書館
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
Web画像を用いた マルチモーダル情報による物体認識
雑音重み推定と音声 GMMを用いた雑音除去
TextonBoost:Joint Appearance, Shape and Context Modeling for Multi-Class Object Recognition and Segmentation 伊原有仁.
SURF: Speeded Up Robust Features
DARTs: Efficient scale-space extraction of DAISY keypoints
CV輪講 姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡
マイクロシミュレーションにおける 可変属性セル問題と解法
大阪教育大学大学院教育学研究科 総合基礎科学専攻 中窪 仁
画像情報を用いた交通流計測 情報工学科 藤吉研究室 EP02076 都築勇司
Semi-Supervised QA with Generative Domain-Adaptive Nets
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
プログラム実行履歴を用いたトランザクションファンクション抽出手法
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
サポートベクターマシン によるパターン認識
音高による音色変化に着目した 音源同定手法
画像認識レポート課題 ガイダンス.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
モデルの適用範囲 モデルの適用領域 Applicability Domain (AD)
物体領域特徴の自動選定とマルチカーネル学習を用いた 特徴統合による一般物体認識
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
音高による音色変化に着目した音源同定に関する研究
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
東京農業大学 東京情報大学 附属第一高等学校・中等部 附属第二高等学校 附属第三高等学校・中等部
Data Clustering: A Review
複数特徴量の重み付け統合による一般物体認識
SURF+BoFによる特定物体認識 卒業研究1 1 11/27/11.
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
マルチ識別器を用いた 花画像検索システムの構築
物体検出による視覚補助システム T215085 若松大仁 白井研究室.
Nightmare at Test Time: Robust Learning by Feature Deletion
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
論文紹介: “Joint Embedding of Words and Labels for Text Classification”
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
距離空間ピラミッドを用いた LLCによる3次元物体認識
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
尤度最大化基準を用いたエコー推定に基づく 車室内音響エコーキャンセラの検討
パターン認識特論 ADA Boosting.
ビデオデータベースを用いた 流体画像に基づくアニメーション生成
パターン認識特論 ADA Boosting.
Webページタイプによるクラスタ リングを用いた検索支援システム
CSP係数の識別に基づく話者の 頭部方向の推定
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
雑音環境下における Sparse Coding声質変換 3-P-49d
転移学習 Transfer learning
Presentation transcript:

Building text features for object image classification 福田考晃

はじめに Wang, Hoiemらによって提案 [CVPR,2009] なにをするものか? どのように? 組み合わせて利用 未知画像の既知カテゴリへの分類 どのように? 画像から得られる特徴 テキストの特徴( flickr tag ) 組み合わせて利用

手法の流れ 入力:未知画像 処理:2つの識別器を構築 ビジュアル識別器 テキスト識別器 出力:カテゴリ

ビジュアル特徴 5つの特徴量を利用 SIFT Gist カラーヒストグラム 勾配特徴 Unified特徴(上記4つをまとめたもの)

Gist 画像全体から得られる特徴量 画像を小領域に分割 任意周波数,方向のGaborフィルタの応答算出 強度 Gabor filter

Unified特徴の最適化 2枚を1組の画像対を利用 Unified特徴 重みを変更し,以下の式を最小化 Si:画像対の関係を表す

手法の流れ 入力:未知画像 処理:2つの識別器を構築 ビジュアル識別器 テキスト識別器 出力:カテゴリ

インターネットから取得したデータセット 画像テキスト間の関係 1,000,000枚のデータセット 700,000枚 300,000枚 58カテゴリでflickrを検索 PASCAL + Caltech 256カテゴリ 300,000枚 以下からダウンロード

手法の流れ 入力:未知画像 処理:2つの識別器を構築 ビジュアル識別器 テキスト識別器 出力:カテゴリ

テキスト特徴 Flickrデータセットから6000個のタグとグループ名を抽出 手順 画像入力 K – Nearest Neighborでk個の画像をFlickrデータセットから取得 取得した画像のタグとグループ名から特徴量算出

手法の流れ 入力:未知画像 処理:2つの識別器を構築 ビジュアル識別器 テキスト識別器 出力:カテゴリ

識別器の構築 ビジュアル識別器 テキスト識別器 SVMの利用 識別器の統合 カイ二乗カーネル ロジスティック回帰 特徴量をカイ2乗距離へ射影 検証用データセットを利用 K(x,y)= exp{-² (x,y)} ² (x,y) = i { (||xi-yi||) ² / ||xi+yi|| }

実験 以下を確認 異なるビジュアル特徴量におけるテキスト特徴の影響 テキスト特徴とビジュアル特徴の統合の影響 学習画像の影響 補助データセットの画像枚数の影響 カテゴリ名の影響

実験1 異なるビジュアル特徴におけるテキスト特徴の構築 KNN精度に依存 各特徴量の精度比較 ビジュアル特徴に依存 カラーヒストグラムが低 Unifiedが高

実験2 テキスト特徴とビジュアル特徴の統合の影響 互いが相互に作用

実験3 学習画像枚数の影響 画像数少 テキスト特徴の影響大 画像数多 テキスト特徴の影響小 最も高い利得 テキストとビジュアルが一致したとき

実験4 補助データセットの画像枚数 精度上昇 ≠ 枚数 200,000〜600,000 600,000〜1,000,000 精度上昇大 精度上昇小 精度上昇 ≠ 枚数

実験5 カテゴリ名の影響 実験対象 類似カテゴリの存在に依存しない カテゴリ名に類似したタグが存在する (W) カテゴリ名に類似したタグが存在しない (WO) 類似カテゴリの存在に依存しない

おわりに テキストの特徴 Unified特徴量は有効に作用 テキスト識別器 + ビジュアル識別器 = 相互に作用 Flickrのタグ,グループ名を利用 Unified特徴量は有効に作用 テキスト識別器 + ビジュアル識別器 = 相互に作用 学習画像数が少ない時テキスト特徴の影響大 精度向上≠ 補助データセット枚数 カテゴリ名の影響はない