Fuzzy c-Means法による クラスター分析に関する研究

Slides:



Advertisements
Similar presentations
多目的GAに対する パレート最適個体の分布制御 九州大学大学院工学府知能機械システム専攻徳井 宏司.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
世帯マイクロデータの適合度評価における 重みの決定手法
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
平成14年2月8日 卒業研究報告 相関行列に基づく非計量多次元尺度法 に関する研究
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
「わかりやすいパターン認識」 第1章:パターン認識とは
先端論文ゼミ -タイトル- Identification of homogeneous regions for regional frequency analysis using the self organizing map (自己組織化マップを使っている地域の頻度分析のための均一な地 方の識別)
Data Clustering: A Review
マーケティング戦略の決定.
行動モデル夏の学校 買い物地選択行動 モデルのパラメータ推定
Scalable Collaborative Filtering Using Cluster-based Smoothing
圧縮類似度を用いた方言の自動分類 ~ライス符号を用いた前処理~ ~連結クラスタリング法~ ~余弦類似度を用いた方言分類木の評価~
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
回帰分析.
ベイズ的ロジスティックモデル に関する研究
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
第2章補足Ⅱ 2項分布と正規分布についての補足
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
EMアルゴリズム クラスタリングへの応用と最近の発展
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
マイクロシミュレーションにおける 可変属性セル問題と解法
日本大学 文理学部 情報システム解析学科 谷研究室 益田真太郎
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
VI-7 連続分布(面データ)を分析する方法
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
analysis of survey data 第3回 香川大学経済学部 堀 啓造
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
プログラム実行履歴を用いたトランザクションファンクション抽出手法
サポートベクターマシン によるパターン認識
第9章 混合モデルとEM 修士2年 北川直樹.
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
多変量解析ゼミ 第10回 第12章クラスター分析 発表者 直江 宗紀.
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
Data Clustering: A Review
ファジィ制約充足問題への 連続領域の導入 Introducing continuous domains to
クラスター分析入門 高崎経済大学 宮田 庸一.
マルチ識別器を用いた 花画像検索システムの構築
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
ベイズ最適化 Bayesian Optimization BO
自己組織化マップ Self-Organizing Map SOM
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
岩手県立大学 ソフトウェア情報学部 教育情報システム学講座 4年 ;継田 優子
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
データ解析 静岡大学工学部 安藤和敏
JNNS-DEX-SMI-玉川 公開講座 「交換モンテカルロ法とその応用」
メソッドの同時更新履歴を用いたクラスの機能別分類法
Le Lu, Rene Vidal John Hopkins University (担当:猪口)
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
プログラミング論 相関
実験計画法 Design of Experiments (DoE)
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
Webページタイプによるクラスタ リングを用いた検索支援システム
統計現象 高嶋 隆一 6/26/2019.
<PC48> エゾマツ・トドマツ稚樹群の動態に 環境条件が与える影響
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

Fuzzy c-Means法による クラスター分析に関する研究 畜産経営管理学講座 統計研究室 久田純司

クラスター分析とは クラスター分析とはデータ以外に基準を設定することなくデータの集まりをいくつかのグループに分ける方法

目的 1.HCMとFCMのクラスタリング精度の比較 2.FCMの特徴である帰属度の考察

HCM クラスタリングする対象を最も近いクラスター中心に割り当て中心を更新する方法 ある個体が属するクラスターは1つ ある個体  がクラスター  に属する           =1   ある個体  がクラスター  に属さない          =0

FCM FCMは個体がクラスターに帰属する度合いにあいまいさを認めあいまいさを帰属度で表す 変数  に0から1までの値をとることを許しその値を帰属性の度合い,つまり帰属度とする 各個体について全てのクラスターに対する帰属度を加えたものが1になる

目的関数の導入 FCMはこの目的関数を最適化し収束させることでクラスタリングを行う は 1を満たす適当なパラメータ   は    1を満たす適当なパラメータ   を大きくすると帰属性の度合いはよりあいまいになる はクラスター   と個体   との距離

シミュレーション実験 HCMとFCMのクラスタリング精度の評価 それぞれ違う特徴をもつ2つのデータ群を2つのクラスターに分類し誤判別の割合で評価を行う FCMでは帰属度の一番大きいクラスターへ各個体を帰属させた

2つの2次元正規分布

(3)( )=( 0.5, -0.5) HCM 各20個,計40個 FCM(m=2,…,6) (1)(    )=( 0.5, 0.5 )              (2)(    )=( -0.5, -0.5 )     (3)(    )=( 0.5, -0.5)     HCM 各20個,計40個       FCM(m=2,…,6)       乱数を発生 を適用し2個の クラスターに分類

1つの の値について10000回繰り返し誤判別の割合を求める 一方から発生したデータを他方のクラスターへ分類 誤判別として個数を数える 1つの  の値について10000回繰り返し誤判別の割合を求める

(1)の場合のデータ分布イメージ

(1)の場合の結果

(2)の場合のデータ分布イメージ

(2)の場合の結果

(3)の場合のデータ分布イメージ

(3)の場合の結果

クラスタリング精度の評価   FCMによる帰属度の大きいクラスターに各個体を帰属させるクラスタリングの精度が良いという傾向を得た

実際のデータへの適用

作家のMISIMA氏,NAKAJIMA氏,INOUE氏の 作品において2種類の助詞が使用されている相対頻度を表すデータを3個のクラスターに分類するクラスタリングを行う 彼等の作品に助詞の使用頻度による特徴があれば彼等の作品によるクラスターが作成されるはず HCMとFCM(m=2)を適用

分析結果

まとめ FCMの帰属度の大きいクラスターへ各個体を帰属させるクラスタリング技法の精度の良さを示す傾向を得た

帰属度による帰属順位