Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.

Slides:



Advertisements
Similar presentations
多目的GAに対する パレート最適個体の分布制御 九州大学大学院工学府知能機械システム専攻徳井 宏司.
Advertisements

三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
世帯マイクロデータの適合度評価における 重みの決定手法
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
リフレッシュ型分散遺伝的アルゴリズムの 組み合わせ最適化問題への適用
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
遺伝的アルゴリズム  新川 大貴.
対話型遺伝的アルゴリズムを用いた室内レイアウトシステムの開発
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
シミュレーション論 Ⅱ 第12回 強化学習.
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
マイクロシミュレーションにおける 可変属性セル問題と解法
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
変数選択手法っていろいろあるけど 何を使えばいいの?
Generative Topographic Mapping (GTM) でデータの 可視化・回帰分析・モデルの 逆解析を一緒にやってみた
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
ガウス過程による回帰 Gaussian Process Regression GPR
シミュレーション論 Ⅱ 第12回 様々なシミュレーション手法(3) 強化学習.
MPIを用いた並列処理 ~GAによるTSPの解法~
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
モデルの適用範囲 モデルの適用領域 Applicability Domain (AD)
米山研究室紹介 -システム制御工学研究室-
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化
シミュレーション学講義 第**回 スケジューリング問題とJSSP.
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
進化的計算手法の並列計算機への実装 三木 光範
主成分分析 Principal Component Analysis PCA
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
アルゴリズムとプログラミング (Algorithms and Programming)
遺伝的交叉を用いた 並列シミュレーテッドアニーリング 同志社大学工学部/大学院 廣安知之,三木光範,○小掠真貴
部分的最小二乗回帰 Partial Least Squares Regression PLS
適応的近傍を持つ シミュレーテッドアニーリングの性能
線形判別分析 Linear Discriminant Analysis LDA
法数学のための 機械学習の基礎 京大(医) 統計遺伝学分野 山田 亮 2017/04/15.
ベイズ最適化 Bayesian Optimization BO
Stepwise (ステップワイズ) 法による 説明変数 (入力変数・記述子・ 特徴量) の選択
Introduction to Soft Computing
Data Clustering: A Review
サポートベクターマシン Support Vector Machine SVM
自己組織化マップ Self-Organizing Map SOM
Data Clustering: A Review
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
ビット空間における GAの解探索モニタリングシステム
全体ミーティング (5/23) 村田雅之.
環境分散遺伝的アルゴリズムの 多目的最適化問題への適用
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
リッジ回帰(Ridge Regression, RR) Least Absolute Shrinkage and Selection Operator (LASSO) Elastic Net (EN) 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
誤差逆伝播法による ニューラルネットワーク (BackPropagation Neural Network, BPNN)
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
実験計画法 Design of Experiments (DoE)
Locally-Weighted Partial Least Squares LWPLS 局所PLS
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
分散遺伝的アルゴリズムにおけるパラメータの検討
Boruta 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
自己縮小画像と混合ガウス分布モデルを用いた超解像
転移学習 Transfer learning
各種荷重を受ける 中空押出形成材の構造最適化
混合ガウスモデル Gaussian Mixture Model GMM
外れ値検出 Outlier Detection 外れサンプル検出 Outlier Sample Detection
Presentation transcript:

Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌

GAPLS, GASVR とは? GAPLS: 遺伝的アルゴリズム (GA) と PLS とを組み合わせた 変数選択手法 PLS でクロスバリデーションを行ったときの r2 が大きくなるように変数が 選択される GASVR: GA と SVR とを組み合わせた変数選択手法 SVR でクロスバリデーションを行ったときの r2 が大きくなるように変数が 選択される 染色体にSVRのハイパーパラメータも入れることで、高速化している

PLS, SVR PLS, SVRについてはこちら

遺伝的アルゴリズム (GA) の流れ 遺伝的アルゴリズム (Genetic Algorithm, GA): 生物の遺伝の様子を模倣した、最適化のためのアルゴリズム ランダムに初期化された個体の郡 各個体 1 1 1 … 0, 1 ・・・ 染色体 適合度の計算 各個体の適合度を計算 適合度に応じて親となる個体を選ぶ (ルーレット選択、トーナメント選択など) 淘汰と選択 遺伝的操作 交差 突然変異 1 1 1 1 次世代の個体 1 1 1 1 1 適合度の大きな個体を効率的に得ることができる

GAPLS 個体の表現方法 個体の染色体である 1, 0 を、 説明変数の数 1 : 選択された説明変数 0 : 選択されない説明変数 とする 個体が実数の GA では、それぞれ 0 から 1 の間の実数で表し、 たとえば “0.5” より大きい染色体の番号を、選択された説明変数とする “0.5” の値を変更することで、選択される説明変数の数を調整できる 染色体の 0 ~ 1 の数が大きい順に m 個の説明変数を選択すれば 選択される説明変数の数を決められる 説明変数の数 各個体 1 1 1 …

GAPLS 適合度 選択された説明変数のみを用いて、目的変数との間で PLS によるクロスバリデーションを行う 最適成分数におけるクロスバリデーション推定値を用いた r2 を 適合度とする クロスバリデーションについてはこちら: https://datachemeng.com/modelvalidation/

GASVR 個体の表現方法 1/2 個体の前半の染色体である 1, 0 を、 1 : 選択された説明変数 0 : 選択されない説明変数 とする 個体の後半の染色体を、C, ε, γ とする 説明変数の数 C ε γ 各個体 1 1 1 … 1 0.25 0.5 2

GASVR 個体の表現方法 2/2 個体が実数の GA では、それぞれ 0 から 1 の間の実数で表し、 たとえば “0.5” より大きい染色体の番号を、選択された説明変数とする “0.5” の値を変更することで、選択される説明変数の数を調整できる 染色体の 0 ~ 1 の数が大きい順に m 個の説明変数を選択すれば 選択される説明変数の数を決められる

GASVR 適合度 選択された説明変数のみを用いて、目的変数との間で 与えられた C, ε, γ で SVR によるクロスバリデーションを行う 最適成分数におけるクロスバリデーション推定値を用いた r2 を 適合度とする クロスバリデーションについてはこちら: https://datachemeng.com/modelvalidation/

どうやって実際にGAPLS, GASVRを実行するか? scikit-learn や DEAP を用いて、GAPLS や GASVR のデモを 行うプログラムを作成しました https://github.com/hkaneko1985/gapls_gasvr

注意点 ランダム性があるため、GAPLS, GASVR を行った結果、 いつも同じ結果が得られるとは限らない クロスバリデーションをして推定した結果がよくなるように変数を 選択しているが、モデルがオーバーフィッティングする可能性もある