Data Clustering: A Review

Slides:



Advertisements
Similar presentations
利用者のプライバシを保護す る協調フィルタリング方式の 提案 7adrm011 木澤寛厚. 背景 商品の量が多い 見つからな い orz ネットショップ.
Advertisements

A Simple Constant Time Enumeration Algorithm for Free Trees 中野 眞一 宇野 毅明 群馬大学 情報学研究所 2003 年 9 月 19 日 アルゴリズム研究会.
Cluster Analysis 徳山研究室M2 鈴木 晶子.
人工知能特論 8.教師あり学習と教師なし学習
「わかりやすいパターン認識」 第1章:パターン認識とは
東京工科大学 コンピュータサイエンス 亀田弘之
クラスタ分析手法を用いた新しい 侵入検知システムの構築
Data Clustering: A Review
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
第11回 整列 ~ バケットソート,基数ソート,ヒープソート~
構造的表現 Structure and Space
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
3-5 クラス図の関係その3 福本研究室 神田 祐輔.
人工知能概論 第10回 学習と認識(1) クラスタリング
リンク構造を考慮したベクトル空間法によるWebグラフ分割手法に関する研究
情報科学1(G1) 2016年度.
データ構造とアルゴリズム 分割統治 ~ マージソート~.
EMアルゴリズム クラスタリングへの応用と最近の発展
マーケティング戦略.
クラスタリング 距離と分類の考え方.
線形代数学 谷津 哲平 第1章 ベクトル 1.1 ベクトル空間 1.2 ベクトルの一次独立性 1.3 部分ベクトル空間
Fuzzy c-Means法による クラスター分析に関する研究
Spectral Clustering による 語義曖昧性解消のための 教師あり類似度学習
Data Clustering: A Review
決定木とランダムフォレスト 和田 俊和.
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
IIR輪講復習 #17 Hierarchical clustering
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
Internet広域分散協調サーチロボット の研究開発
情報知能学基礎演習 豊田秀樹(2008)『データマイニング入門』 (東京図書)第6章
Anja von Heydebreck et al. 発表:上嶋裕樹
多変量解析ゼミ 第10回 第12章クラスター分析 発表者 直江 宗紀.
参照モデルを利用したプロセス構成要素の調査・記述の手法
分子生物情報学(2) 配列のマルチプルアライメント法
Data Clustering: A Review
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
プログラミング 4 整列アルゴリズム.
クラスター分析入門 高崎経済大学 宮田 庸一.
階層的境界ボリュームを用いた 陰関数曲面の高速なレイトレーシング法
第4章 社会構造概念はどのように豊穣化されるか
Data Clustering: A Review
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
構造的表現 Structure and Space
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
アルゴリズムとデータ構造 第3章 ヒープ 5月31日分
アルゴリズムとデータ構造 第3章 ヒープ 5月31日分の復習
アルゴリズムとプログラミング (Algorithms and Programming)
Data Clustering: A Review
Data Clustering: A Review
自己組織化マップ Self-Organizing Map SOM
Data Clustering: A Review
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
第16章 動的計画法 アルゴリズムイントロダクション.
短い部分文字列の ミスマッチトレランスを 高速計算するアルゴリズム
アルゴリズムとデータ構造 2012年7月2日
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
アルゴリズムとプログラミング (Algorithms and Programming)
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
メソッドの同時更新履歴を用いたクラスの機能別分類法
Le Lu, Rene Vidal John Hopkins University (担当:猪口)
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
情報ネットワーク 岡村耕二.
アルゴリズムとデータ構造 2013年7月2日
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
Webページタイプによるクラスタ リングを用いた検索支援システム
時間情報に基づく多様な中心性に着目した 動的ネットワーク分析の提案
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Presentation transcript:

Data Clustering: A Review A.K. Jain, M.N. Murty, P.J. Flynn 院生ゼミ ‘04年4月27日(火曜日) 新納浩幸

本日の私の担当 第5章: (前ふりの部分は谷津君) 5.1 Hierarchical Clustering Algorithms ● Agglomerative (凝集的) Single-Link ● Agglomerative Complete-Link ○ Hierarchical Agglomerative Complete-Link

手法の概要 近いものを 集めてゆく手法

デンドログラム 階層的クラスタリング 類似度 の過程と結果はこの デンドログラムに要約 できる ある類似度で切ると 複数個のクラスタ結果 が得られる

? 手法の位置づけ Clustering Hierarchical Partitional Complete Link Single Link Minimum-Variance (省略) こっちはまた後でやる

Single-Link 最も近い要素の間の距離で クラスター間の距離を測る

Complete-Link 最も遠い要素の間の距離で クラスター間の距離を測る

参考)群平均法 クラスターの重心間の距離で クラスター間の距離を測る

Chain 効果 Single-Link の欠点 Complete-Link はこの問題を受けない, コンパクトなクラスターを作る傾向がある

Single-Link の長所 多目的に使える こんなのでもOK でも通常は Complete-Link の方を つかうのが良い

Single-Link アルゴリズム (1) 各パターンをクラスタとみなす. パターン間の距離を測ってソートしておく. 距離を測り,最も距離が短いクラスタどうしを 併合する.この際,(1)で作ったソート結果を利用). 1つのクラスタにまとまったら終わり. (3)結果はデンドログラムで表現できる

Complete-Link アルゴリズム (1) 各パターンをクラスタとみなす. パターン間の距離を測ってソートしておく. (2) Compete-Link の定義に従って,各クラスター間の 距離を測り,最も距離が短いクラスタどうしを 併合する.この際,(1)で作ったソート結果を利用). 1つのクラスタにまとまったら終わり. (3)結果はデンドログラムで表現できる

階層的クラスタリングのアルゴリズム (1) 各パターンをクラスタとみなす. クラスター間の近接行列を作成する. (2) 近接行列に従って,最も距離が短いクラスタどうしを 併合する.結果を近接行列に反映させる. 1つのクラスタにまとまったら終わり. (3)結果はデンドログラムで表現できる

分割的手法との比較 Partitional …. パターンが独立した島になっているときに うまく働く 計算に必要な時間とメモリは少ない. Hierarchical …. 多目的,パターンが独立した島になって いなくてもOK. 計算に必要な時間とメモリは多い.