Data Clustering: A Review

Slides:



Advertisements
Similar presentations
多目的GAに対する パレート最適個体の分布制御 九州大学大学院工学府知能機械システム専攻徳井 宏司.
Advertisements

©2008 Ikuo Tahara探索 状態空間と探索木 基本的な探索アルゴリズム 横形探索と縦形探索 評価関数を利用した探索アルゴリズム 分岐限定法 山登り法 最良優先探索 A ( A* )アルゴリズム.
三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
到着時刻と燃料消費量を同時に最適化する船速・航路計画
TCPコネクションの分割 によるスループットの向上
Data Clustering: A Review
遺伝的アルゴリズム  新川 大貴.
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
先端論文紹介ゼミ Tracking control for nonholonomic mobile robots: Integrating the analog neural network into the backstepping technique 非ホロノミック移動ロボットのための追従制御:
モード付き並列機械における オンラインスケジューリング
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
先端論文紹介ゼミ Role-based Context-specific Multiagent Q-learning
PSOLA法を用いた極低ビットレート音声符号化に関する検討
CV輪講 姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡
Semi-Supervised QA with Generative Domain-Adaptive Nets
Buried Markov Modelを用いた 構音障害者の音声認識の検討
EMO分野における最近の動向 立命館大学 情報理工学部 知能情報学科 渡邉 真也
型付きアセンブリ言語を用いた安全なカーネル拡張
協調機械システム論 ( ,本郷) 協調機械システム論 東京大学 人工物工学研究センター 淺間 一.
ソースコードの変更履歴における メトリクス値の変化を用いた ソフトウェアの特性分析
MPIを用いた並列処理 ~GAによるTSPの解法~
Data Clustering: A Review
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
米山研究室紹介 -システム制御工学研究室-
IIR輪講復習 #17 Hierarchical clustering
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化
第7章 疎な解を持つカーネルマシン 修士2年 山川佳洋.
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
進化的計算手法の並列計算機への実装 三木 光範
予測に用いる数学 2004/05/07 ide.
遺伝的交叉を用いた 並列シミュレーテッドアニーリング 同志社大学工学部/大学院 廣安知之,三木光範,○小掠真貴
Data Clustering: A Review
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
電機情報工学専門実験 6. 強化学習シミュレーション
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
Data Clustering: A Review
適応的近傍を持つ シミュレーテッドアニーリングの性能
知識科学研究科 知識システム構築論講座 林研究室 佛明 智
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
B03 量子論理回路の 最適化に関する研究 西野哲朗,垂井淳,太田和夫,國廣昇 電気通信大学 情報通信工学科.
Introduction to Soft Computing
Data Clustering: A Review
Q3 On the value of user preferences in search-based software engineering: a case study in software product lines Abdel Salam Sayyad (West Virginia University,
Data Clustering: A Review
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
第4回 メモリ管理 主記憶(メインメモリ)の管理 固定区画方式と可変区画方式 空き領域の管理 スワッピング.
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
土木計画学 第12回(1月14日) 計画における代替案の作成2 担当:榊原 弘之.
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
環境分散遺伝的アルゴリズムの 多目的最適化問題への適用
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
アルゴリズムとデータ構造 --- 理論編 --- 山本 真基
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
Data Clustering: A Review
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
各種荷重を受ける 中空押出形成材の構造最適化
遺伝的交叉を用いた 並列シミュレーテッドアニーリングの検討 小掠 真貴 廣安 知之 三木 光範 角 美智子 岡本 祐幸 同志社大学大学院
Presentation transcript:

Data Clustering: A Review A.K. Jain, M.N. Murty, P.J. Flynn ~5.10 A Comparison of Technique~ 院生ゼミ ‘04年6月15日(火曜日) 谷津 哲平

Techniques 決定論的で確率論的な検索技術のほとんどが“二乗エラー手法”を使用する 階層型ほど多能でない 階層型 分割型 Artifical Neural Network (ANN) Genetic Algorithm(GA) Simulated Annealing(SA) Tabu Search(TS)  決定論的で確率論的な検索技術のほとんどが“二乗エラー手法”を使用する 階層型ほど多能でない

Evolutional approaches 進化的アプローチ 「大域的な探索技術」「一つ以上の解決策で探索する」 他のアプローチ 「局所的な探索技術」「一つの解決策で探索する」 ANN, GA, SA, TS は様々な学習,制御のパラメータの選択に敏感 (難しい) 分野依存の知識  理論上,明白な 領域情報(domain knowledge)を使用しないので, これらの4つの方法はウィークメソッド[Rich 1983]である 進化的アプローチの特徴 評価関数が不連続であっても最適解を見つけられる

Comparison 1 パフォーマンス Presented in Mishra and Raghavan [1994] Randomized branch-and-bound (RBA) を提案 SA, GA, TS, Hybrid Search (HS) 1989 との性能比較 ※ データセット200未満 結果 GA : 1次元データにおいて良い SA : 遅いので魅力的でない TS : 最も性能が良い RBA : HS : 高い次元において良い

Comparison 2 計算速度 Presented in Al-Sultan and Khan [1996] k-means, SA, TS, GA での実験 ※ データセット200未満 結果  GA, SA, TS は品質が同等で,k-means より良いが,実行時間は k-means が最も効率的 GA : 速い SA : 遅い(TSより時間がかかる) TS : 中 k-means : 最も速い

Comparison 3 品質 Presented in Babu et al. [1997]  stochastic connectionist approach (SCA)を提案 SAと k-means との標準のデータセットに関する性能比較 結果 SCA が SA, k-means より品質(solution quality)が優れている  進化的アルゴリズムはデータサイズが1000以下で低い次元データのときに良い

Comparison 4 大きいデータセット Presented in Mao and Jain [1996] K-means, ANN, kohonen net は大きいデータセット, 他のアプローチは小さいデータセットで比較 結果 ANN, GA, TS, SA は学習,制御のパラメータを得ることが難しい 大きいデータセットでは時間がかかる k-means は局所的最適解に収束するが 他の手法を使うことで大きいデータセットにも使える

結論 実験に基づく研究で領域情報を併用すると 性能が向上することが明らかになった GA, SA, ANN, TS の領域情報を使うのは役立つ  実験に基づく研究で領域情報を併用すると 性能が向上することが明らかになった  GA, SA, ANN, TS の領域情報を使うのは役立つ  しかし,球型の領域を作る傾向があり制約になる可能性がある  実際,クラスタベースの文献検索では階層型が分割型より良いことが観測された[Rasmussen 1992]