先端論文ゼミ -タイトル- Identification of homogeneous regions for regional frequency analysis using the self organizing map (自己組織化マップを使っている地域の頻度分析のための均一な地 方の識別)

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
コンピュータプラクティ スⅠ 比較実験 水野嘉明. 本日の予定 計算量について 「比較実験」  パラメータを変化させての比較 ⇒ 実験1  二つのプログラムの比較 ⇒ 実験2  実験レポート R3として提出 2.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
地理情報システム論 第11回 GIS による処理技法 アドレスマッチングの利用 空間的分布の特徴の把握.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
白井ゼミ 豊田秀樹(2008)『データマイニング入門』 (東京図書)。4章
BRIEF: Binary Robust Independent Elementary Features
平成14年2月8日 卒業研究報告 相関行列に基づく非計量多次元尺度法 に関する研究
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
「わかりやすいパターン認識」 第1章:パターン認識とは
数理統計学(第四回) 分散の性質と重要な法則
Data Clustering: A Review
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
先端論文紹介ゼミ Tracking control for nonholonomic mobile robots: Integrating the analog neural network into the backstepping technique 非ホロノミック移動ロボットのための追従制御:
圧縮類似度を用いた方言の自動分類 ~ライス符号を用いた前処理~ ~連結クラスタリング法~ ~余弦類似度を用いた方言分類木の評価~
「Self-Organizing Map 自己組織化マップ」 を説明するスライド
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
回帰分析.
EMアルゴリズム クラスタリングへの応用と最近の発展
マーケティング戦略.
果物識別 マハラノビス距離を求める.
サポートベクターマシン によるパターン認識
Fuzzy c-Means法による クラスター分析に関する研究
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
決定木とランダムフォレスト 和田 俊和.
第9章 混合モデルとEM 修士2年 北川直樹.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
IPアドレスについて      発表者  M3KI.
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Computer Graphics 第10回 レンダリング(4) マッピング
多変量解析ゼミ 第10回 第12章クラスター分析 発表者 直江 宗紀.
主成分分析 Principal Component Analysis PCA
Data Clustering: A Review
クラスター分析入門 高崎経済大学 宮田 庸一.
15K1117 下窪 聖人 15K1013 坂本 倖輝 15K1112 黒川 晶太 15K1015 関根 修斗
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
Data Clustering: A Review
ニューラルコンピューティングを理解する 2006/12/12 Graduate School of Media and Governance
Number of random matrices
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
線形判別分析 Linear Discriminant Analysis LDA
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
ベイズ最適化 Bayesian Optimization BO
自己組織化マップ Self-Organizing Map SOM
Data Clustering: A Review
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
データ解析 静岡大学工学部 安藤和敏
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
誤差逆伝播法による ニューラルネットワーク (BackPropagation Neural Network, BPNN)
Locally-Weighted Partial Least Squares LWPLS 局所PLS
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
統計現象 高嶋 隆一 6/26/2019.
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

先端論文ゼミ -タイトル- Identification of homogeneous regions for regional frequency analysis using the self organizing map (自己組織化マップを使っている地域の頻度分析のための均一な地 方の識別) B4 三浦 善輝

1.Introduction (紹介) この研究に用いられている人工ニュー ラルネットは、コホネンによって紹介 された自己組織化マップ(SOM)であ る。  ⇒言葉と画像認識のフィールドの情 報処理ツールとして、最初に使われた。

1.Introduction (紹介) この論文の目的は、地域の頻度分析の ために、SOMを使って均一な地方を特 定することである。 SOMは制御された実験データを使用し て2つのクラスタ分析、K-means法と ward法で比較されます。

1.Introduction (紹介) クラスタ分析 ⇒地域の頻度分析のために均一な地方を 特定するのに用いられる。  ⇒地域の頻度分析のために均一な地方を 特定するのに用いられる。  ⇒統計多変量解析の標準的な方法である。  ⇒大きくて複雑なデータセットをグルー プのメンバーが類似した特徴を共有する 少数のデータグループに下げることがで る。

2.Self organizing map (自己組織化マップ) SOMの構造は、図1に示されます。 SOMは、1個の入力層と1個の出力層(コホネン層)から成ります。 [SOMのアルゴリズム] 1.入力層は、M個のニューロンである。 3.重みベクトルと入力ベクトルの間の ユークリッド距離を求める。 出力層は、平面で組織されたN個の ニューロンである。 4.入力ベクトルから最も小距離である 重みベクトルによる出力ニューロンは 勝ちニューロン   とする。 , 2.図1の中の入力層と出力層をつ なぐ線は、重みを意味します。 5.時刻t+1の更新している重みベクト ルを求める。 初めは、小さな乱数で初期化 される。 η:学習率パラメータ σ:偏差

3.Experimental design (実験的なデザイン) 3.1. The process of the K-means method              (K-means法の処理) 各データxi(1…n)に対してランダムにクラスタを割 り振る。 割り振ったデータをもとに各クラスタの中心 Vj(1…K)を計算する。計算は通常割り当てられた データの各要素の平均が使用される。 各 xi と各 Vj との距離を求め、xi を最も近い中心 のクラスタに割り当て直す。 上記の処理で全ての xi のクラスタの割り当てが 変化しなかった場合は処理を終了する。それ以 外の場合は新しく割り振られたクラスタから Vj を再計算して上記の処理を繰り返す。

3.Experimental design (実験的なデザイン) 3.2. The process of Ward's method (ウォード法の処理) ・クラスタ内の偏差平方和:S= を計算 N:クラスタ内のデータの数  M:M次元ベクトル Xi:標本データ(i=1 ~N、j= 1 ~M) X:標本平均(クラスターの重心) ・偏差平方和の増加量⊿Sができるだけ小さくなるようにクラスタをまとめる。 ・上記の処理を繰り返し、クラスタをまとめる。

3.Experimental design (実験的なデザイン) 3.3. Results and discussions (結果と議論) ・(a)と(b)の実験には、全3つのデータセット ・(a):全てが球のデータセット  (b):1つの球のデータセット、    2つのベルトの形のデータセット

3.Experimental design (実験的なデザイン) 3.3. Results and discussions (結果と議論) ・図3は、2つのデータセットを15×15セルのネットワーク上に配置した。 ・それぞれ(a),(b)は、3つのマップに分けられる。

3.Experimental design (実験的なデザイン) 3.3. Results and discussions(結果と議論) ・図4:k-mean法、図5:ward法 ・図4、図5共にいくつかの境界点は、間違ったクラスタに分類されている。

3.Experimental design (実験的なデザイン) 3.3. Results and discussions(結果と議論) ・クラスタ分析実験の結果(表1)は、正常にクラスタに割り当てられている割合(%)として表現される。 ・SOMのクラスタ精度:全て100% ・データセット1のクラスタ精度:K-meansは97.3%、wardは95.0% ・データセット2のクラスタ精度:K-meansは68.3%、wardは70.3% ・特にデータセットがベルトの形((b)の実験)のとき、SOMはK-means法とward法より正確である。

4.Application(適用) 4.1.The study area and data(調査領域とデータ) ・図6は台湾の実際の雨量データ (+は雨量計の位置) ・調査領域は36,000 ・154台の雨量計

4.Application(応用) 4.2.Formation of regions(地方の形成) ・地方形成のために、利用できるデータはクラスタ分析に使われる。 ・緯度(m)[Latitude] ・経度(m)[Longitude] ・標高(m)[Elevation] ・年間平均降水量(mm)[Mean annual rainfall] ・年間降水量の標準偏差(mm)[Standard deviation of annual] ・各月間の月間平均降水量(mm)[Mean monthly rainfall for each month] ・各データには、目盛りの違いがあるので、データが0~1の間の値になるように計算される。

4.Application(応用) 4.2.Formation of regions(地方の形成) ・図7は、12×12セルのネットワーク上で得られる2次元のマップ ・157台の雨量計は、8つの集団に分類される。

4.Application(応用) 4.2.Formation of regions(地方の形成) ・図7で分類された雨量計の位置は 、図8のようになる。

4.Application(応用) 4.3.Heterogeneity measure(不均一性の測定) ・現場の特徴がクラスタ分析において、均一に特定されているか調査する ために、ホスキンとウォリスが開発した異質性検査(Heterogeneity test) を使ている。 ・異質性検査は、L-memontの分散と均一な地域に予想されること とを比較します。 ・加重された標準偏差は、 として計算 として計算 ・N:サイトの数 ・ :i番目のサイトのデータの数 ・ :sample L-CLのi番目のデータ

4.Application(応用) 4.3.Heterogeneity measure(不均一性の測定) ・異質性検査統計 :平均 :標準偏差 ・if H < 1 ならば “均一である” ・if 1 < H < 2 ならば “なんとかして不均一である” ・if H > 2 ならば “不均一である”

4.Application(応用) 4.3.Heterogeneity measure(不均一性の測定) □均一である □なんとかして不均一である □不均一である

5.Summary and conclusions (概要と結論) SOMは、K-mean法、ウォード法より 正確である。