Presentation is loading. Please wait.

Presentation is loading. Please wait.

Dataset.

Similar presentations


Presentation on theme: "Dataset."— Presentation transcript:

1 Dataset

2 世の中のComputer Visionデータセット
利用 ベンチマークとして? リソースとして? 分野 動画?Or 静止画? 物体認識 シーン認識 物体検出 顔認識 ....

3 利用目的 ベンチマーク 自分の手法の正当性を主張 他の方法との比較が可能

4 利用目的 ベンチマーク Genericなカテゴリをカバー Caltech101,256 PASCAL2 VOC Challenge
MSRC dataset ETH-80 COIL-100 Graz02 UIUC object recognition database MIT objects and scenes And more

5 利用目的 ベンチマーク Specificなカテゴリ Oxford Building Dataset
Oxford flowers Dataset Caltech cars UIUC Dataset Car, butterfly, 3D object, bird MIT face, car dataset Scene dataset INRIA-holidays, UIUC 15 scenes …. And more

6 利用目的 ベンチマーク Generic Specific クラス数はどのくらいか どのレベルでの認識か そのクラスの特徴は?
特化したclassifier Car, faceが多い

7 利用目的 リソース 大量のデータをもってくる ラベル,タグ付けされているデータがほしい

8 利用目的 リソース Label Me Tiny Image Image Net Lotus Hill Database
Amazon mechanical turk ESP game reuters

9 分野 画像分類,認識(classify, recognition) 物体検出(detection) 領域分割(segmentation)
物体,シーン,顔,人物,行動,アクティビティ 物体検出(detection) Bounding boxによる位置特定 領域分割(segmentation)

10 分野 Classification, (Recognition) 注目する物体がメインに写っている(一部怪しげ)
そのGround truthが示されている Caltech101,256 PASCAL2 VOC Challenge MRSC dataset ETH-80 COIL-100 Scene dataset Car , face dataset

11 分野 Detection 物体のあるなしだけでなく位置の特定 Label Me
MIT StreetScenes challenge framework MIT object and scenes dataset Daimler pedestrian detection benchmark Caltech pedestrian dataset PASCAL VOC Challenge

12 分野 Segmentation 領域の分割 Berkeley Segmentation Data Set
UCI Statlog dataset

13 Caltech101, 256 最も良く知られたclassification用Dataset クラスが多め,ぱっと見認識が難しそう
物体認識というよりはシーン認識も含む?

14 MSRC dataset Microsoft Research Cambridge Object Recognition Image Database これもよく使われています 数えてませんが20~30クラス程度,割と良心的?

15 PASCAL VOC Challenge Visual Object Class Challenge
様々なタスク(分野)からのデータセットを作ってみんなで競う(Workshopもあるよ)

16 MIT objects and scenes Recognition, detection用(107classesだが)
領域ごとの正解が示されている(partially annoted) JointBoostingで使ってるdata?

17 Graz02 カテゴリ数は少なめ(3class+negative) 多様な物体の見え方の変化(occlusion, viewpoint)

18 UIUC dataset UIUCのデータセットはたくさんあります
3D, birds, butterfly, scene(8, 6, 7, 15 classes) Specificなデータが多い 3次元での認識が多め?

19 ETH 80 これも一昔前によく使われていた(あんまり最近の論文では見ないような…) 80枚の画像

20 COIL 20, 100 Columbia Object Image Library 井上がよく知っているのではないでしょうか
これも少し古い?

21 Oxford dataset Building(柏木がよく知ってるでしょう) Flower 論文読みました.かなりspecific

22 Indoor Scene Recognition
67Indoor classes, images

23 INRIA Holiday dataset 500 classes(queries), 1491 images

24 Label Me たくさん正解のラベルづけするのは大変なのでみんなで頑張ってやりましょう データを使いたかったらいくつかラベリングしてね
Mechanical turk でお小遣いももらえます

25 Label Me ベンチマーク Train in Spain and test in the rest of the world
6万近くのデータがありそう セグメントでも使える 8 scene categories and annotated objects 単にobject数だけならかなり多い

26 Tiny Image 80,000,000画像を使って53,464の英名詞を表現(英名詞はGoogleから)
それぞれがvisual word, 平均画像(32*32) ラベリングにご協力ください(label me)

27 Tiny Image Word Netのハイエラキを利用 言葉の階層関係の研究をしているWordNet Researchにデータベースがある

28 Image Net こちらもWordNetをもとに画像での階層関係を構築している 現時点ではカテゴリに偏りがある(と思う)
~105+ nodes ~108+ images shepherd dog, sheep dog German shepherd collie animal

29 Lotus Hill Dataset 10,000,000近くの画像 使えるのかどうかがわかりません 物体のパーツ分解も行っている
階層関係あり,最大級のannotated databaseを目指す 使えるのかどうかがわかりません 物体のパーツ分解も行っている

30 Amazon Mechanical Turk
人的タスクならネット上でアルバイトをやってもらいましょう

31 ESP game タグ付けゲーム やってみようかと思いましたがアカウント作成が面倒だったのでやめました
結果(タグ付きデータ)を得ることができるのかはわかりません.たぶん無理でしょう

32 reuters 高画質な写真を買えます


Download ppt "Dataset."

Similar presentations


Ads by Google