法数学のための 機械学習の基礎 京大(医) 統計遺伝学分野 山田 亮 2017/04/15.

Slides:



Advertisements
Similar presentations
Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:
Advertisements

携帯電話について 学籍番号: e13100 大谷 椎奈. このテーマについて調べた理由  ガラケー、 iPhone 、スマートフォンと たくさんの種類があるなかどの利用者が多く、 どうしてそれを選んだのか気になったから  大学生は SNS を何の SNS を どのような目的で使っているか気になったから.
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
Building text features for object image classification
人工知能特論 8.教師あり学習と教師なし学習
「統計的モデルに基づく地球科学における 逆問題解析手法」
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
部分木に基づくマルコフ確率場と言語解析への適用
How to Become a Supply Chain Analyst with Free
Bias2 - Variance - Noise 分解
RFUシグナル強度と 正規・対数正規・ポアソン対数正規・二項分布 ~ノイズとシグナル、ホモとヘテロ~
Semi-Supervised QA with Generative Domain-Adaptive Nets
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
人工知能特論 7.決定木の学習 北陸先端科学技術大学院大学 鶴岡 慶雅.
決定木とランダムフォレスト 和田 俊和.
SVMを用いた生体分子への 金属結合部位予測手法の提案
RFUシグナル強度と 正規・対数正規・ポアソン対数正規・二項分布 ~ノイズとシグナル、ホモとヘテロ~
モデルの適用範囲 モデルの適用領域 Applicability Domain (AD)
極大ノイズを除去する情報量最小化 学習アルゴリズム
Vector 4 = [Vector 3, packet_size]
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
法数学勉強会 2018/07/21 京大(医) 統計遺伝学分野 山田亮
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Online Decoding of Markov Models under Latency Constraints
音高による音色変化に着目した音源同定に関する研究
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
訓練データとテストデータが 異なる分布に従う場合の学習
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
法数学勉強会 2016年4月会 京都大学(医)統計遺伝学分野 山田 亮
法数学における ベイジアンネットワーク(2) ~成書で学ぶ~
遺伝統計学の骨組み Skeleton of Genetic Statistics
生  物  数  学 斉木 里恵.
Data Clustering: A Review
統計解析 第1回 条件付き独立性と確率的グラフィカルモデル 本講義の全体像
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
Z(mm)イベントを用いた ATLAS LVL1 Muon Trigger Systemのコミッショニング
Nightmare at Test Time: Robust Learning by Feature Deletion
Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
Number of random matrices
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
尤度の比較と仮説検定とを比較する ~P値のことなど~
ベイズ最適化 Bayesian Optimization BO
Q3 On the value of user preferences in search-based software engineering: a case study in software product lines Abdel Salam Sayyad (West Virginia University,
確率的画像処理アルゴリズム入門 東北大学 大学院情報科学研究科 田中 和之
法医学会 2013年6月26日 京都大学(医)統計遺伝学 山田 亮
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
187回地震予知連絡会「CSEP日本の取り組みについて」東京大学地震研究所
時間連続性を考慮した 動画からの人物の姿勢推定
遺伝を表現するための言葉 Glossary for genetics
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
ICML読む会資料 (鹿島担当) 教師ナシ の 構造→構造 マッピング 読んだ論文: Discriminative Unsupervised Learning of Structured Predictors Linli Xu (U. Waterloo) , … , Dale Schuurmans.
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
法数学における ベイジアンネットワーク(2) ~成書で学ぶ~
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
自己縮小画像と混合ガウス分布モデルを用いた超解像
ガウシアングラフィカルモデルにおける一般化された確率伝搬法
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
混合試料の構成人数 Nuisance パラメタ
アップデート.
遺伝統計学 Genetic Statistics 2010
Presentation transcript:

法数学のための 機械学習の基礎 京大(医) 統計遺伝学分野 山田 亮 2017/04/15

簡単に言うと 混合試料 構成人数推定 機械学習手法では、従来法に比較して 推定結果が良くなった 3人混合の場合 4人混合の場合 従来法 MAC(Minimum Allele Count) MLE MCMC 簡単に言うと 混合試料 構成人数推定 機械学習手法では、従来法に比較して 推定結果が良くなった 3人混合の場合 4人混合の場合

使われた機械学習手法 k-NN (k-Nearest Neighbors, 近いほうからk番までを使う法) CART (Classification and Regression Trees、決定木法の1つ) Multinomial Logistic Regression Multilayer Perceptron (ニューラル・ネットワーク) SVM (Support Vector Machine) (超平面分離) Python Scikit-learn ライブラリ WEKA

評価手順 たくさんの「真の答え」がわかっている混合試料とその実験結 果を用意(1405試料) 人数推定に有用な指標を選別 候補指標を挙げ、その指標が有用かどうかを「正解に照らして」選別 有用指標を用いて『機械学習』 「正解アリ」の試料-実験結果で、判定ルールを『学習』する 『学習結果』を使って、人数推定する 「隠してあった答え」を見て、推定結果の良さを確認する 『機械学習させた分類器』に、「推定人数」の確率を出力させ る(Probabilistic Assessment… “PACE”)

Fig. 1. Learning curve for a number of contributor estimation model derived from a support vector machine with a Gaussian kernel. The shaded area represents one standard deviation. Testing accuracy: 0.980. Note: the number of samples in this figure represent t... Michael A. Marciano, Jonathan D. Adelman PACE: Probabilistic Assessment for Contributor Estimation— A machine learning-based assessment of the number of contributors in DNA mixtures Forensic Science International: Genetics, Volume 27, 2017, 82–91 http://dx.doi.org/10.1016/j.fsigen.2016.11.006

Fig. 2. Accuracy rates for several number of contributor estimation models, PACE (dynamic threshold), MAC at 50rfu, 100rfu, 150rfu and dynamic threshold. Michael A. Marciano, Jonathan D. Adelman PACE: Probabilistic Assessment for Contributor Estimation— A machine learning-based assessment of the number of contributors in DNA mixtures Forensic Science International: Genetics, Volume 27, 2017, 82–91 http://dx.doi.org/10.1016/j.fsigen.2016.11.006

機械学習のまとめ 手法:いろいろある 教師アリ(と教師ナシ) 過学習(オーバーフィッティング) トレーニングとクロス-バリデーション

“統計学” と “機械学習” とは 同じだけれど、用語が違う! 数学寄りの統計学 アルゴリズム好きな機械学習、情報学的な機械学習

統計系の用語と学習系の用語

機械学習とは・・・ https://www.slideshare.net/hayatomaki9/litmachinelearning  各論・・・