遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.

Slides:



Advertisements
Similar presentations
多目的GAに対する パレート最適個体の分布制御 九州大学大学院工学府知能機械システム専攻徳井 宏司.
Advertisements

三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
世帯マイクロデータの適合度評価における 重みの決定手法
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
リフレッシュ型分散遺伝的アルゴリズムの 組み合わせ最適化問題への適用
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
遺伝的アルゴリズム  新川 大貴.
実証分析の手順 経済データ解析 2011年度.
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
変数選択手法っていろいろあるけど 何を使えばいいの?
Generative Topographic Mapping (GTM) でデータの 可視化・回帰分析・モデルの 逆解析を一緒にやってみた
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
ガウス過程による回帰 Gaussian Process Regression GPR
MPIを用いた並列処理 ~GAによるTSPの解法~
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
モデルの適用範囲 モデルの適用領域 Applicability Domain (AD)
米山研究室紹介 -システム制御工学研究室-
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第14章 モデルの結合 修士2年 山川佳洋.
アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化
シミュレーション学講義 第**回 スケジューリング問題とJSSP.
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
進化的計算手法の並列計算機への実装 三木 光範
主成分分析 Principal Component Analysis PCA
グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定
分子生物情報学(2) 配列のマルチプルアライメント法
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
遺伝的交叉を用いた 並列シミュレーテッドアニーリング 同志社大学工学部/大学院 廣安知之,三木光範,○小掠真貴
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
部分的最小二乗回帰 Partial Least Squares Regression PLS
Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
適応的近傍を持つ シミュレーテッドアニーリングの性能
線形判別分析 Linear Discriminant Analysis LDA
法数学のための 機械学習の基礎 京大(医) 統計遺伝学分野 山田 亮 2017/04/15.
ベイズ最適化 Bayesian Optimization BO
Stepwise (ステップワイズ) 法による 説明変数 (入力変数・記述子・ 特徴量) の選択
Data Clustering: A Review
サポートベクターマシン Support Vector Machine SVM
自己組織化マップ Self-Organizing Map SOM
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
ビット空間における GAの解探索モニタリングシステム
回帰分析(Regression Analysis)
環境分散遺伝的アルゴリズムの 多目的最適化問題への適用
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
リッジ回帰(Ridge Regression, RR) Least Absolute Shrinkage and Selection Operator (LASSO) Elastic Net (EN) 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
誤差逆伝播法による ニューラルネットワーク (BackPropagation Neural Network, BPNN)
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
実験計画法 Design of Experiments (DoE)
Locally-Weighted Partial Least Squares LWPLS 局所PLS
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Boruta 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
自己縮小画像と混合ガウス分布モデルを用いた超解像
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
転移学習 Transfer learning
分子生物情報学(0) バイオインフォマティクス
各種荷重を受ける 中空押出形成材の構造最適化
混合ガウスモデル Gaussian Mixture Model GMM
外れ値検出 Outlier Detection 外れサンプル検出 Outlier Sample Detection
Presentation transcript:

遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌

波長選択・プロセス変数および時間遅れの選択とは? Genetic Algorithm-based Partial Least Squares (GAPLS) や Genetic Algorithm-based Support Vector Regression (GASVR) と 似た、スペクトル解析や時系列データ解析 (ソフトセンサー) 用の手法 GAPLS, GASVR についてはこちら https://datachemeng.com/gaplsgasvr/ スペクトルデータ解析では、波長の領域の組み合わせを、回帰モデルの 推定性能が高くなるように選択 Genetic Algorithm-based WaveLength Selection using Partial Least Squares (GAWLSPLS) Genetic Algorithm-based WaveLength Selection using Support Vector Regression (GAWLSSVR)

波長選択・プロセス変数および時間遅れの選択とは? 時系列データ解析 (ソフトセンサー) では、プロセス変数の組み合わせと それらの時間遅れ幅を、回帰モデルの推定性能が高くなるように選択 Genetic Algorithm-based process Variable and Dynamics Selection using Partial Least Squares (GAVDSPLS) Genetic Algorithm-based process Variable and Dynamics Selection using Support Vector Regression (GAVDSSVR) スペクトルデータと時系列データは似ているため、同じような手法を 用いることができる 参考: https://datachemeng.com/preprocessspectratimeseriesdata/

PLS, SVR PLS, SVRについてはこちら

波長を領域で選択するイメージ 選択する波長領域が3つの場合 説明変数 X 目的変数 y PLS or SVR モデル構築 選択された波長領域 遺伝的アルゴリズム (GA) で最適な領域の組み合わせを選択

波長領域選択 ランダムに初期化された 染色体 染色体 適合度の計算 波長 淘汰と選択 1511 14 2032 21 適合度の計算 波長 淘汰と選択 1511 1524 2032 2052 適合度: 選択された波長領域のみで PLS や SVR を行った際の クロスバリデーション推定値を 用いた r2 遺伝的操作 交差 突然変異 次世代の染色体 波長領域を最適化可能

GAWLSPLSやGAWLSSVRの前に設定すること 選択する領域の数 いくつかの領域数で波長領域を選択し、モデルの推定性能を 確認して適した領域の数を決めてもよい 選択する領域の幅の最大値 ある程度大きくしておけばよい PLS のときの最適成分数、SVR のときの C, ε, γ 遺伝的アルゴリズム (GA) 関係の設定 染色体数、世代数 など

プロセス変数および時間遅れを選択するイメージ 選択するプロセス変数の数が3つの場合 説明変数 X 目的変数 y 時間 遅れ 1 ・・・ 60 1 ・・・ 60 ・・・ 1 ・・・ 60 y プロセス 変数 1 プロセス 変数 2 プロセス 変数 n データ ・・・ PLS or SVR モデル構築 選択された変数 遺伝的アルゴリズム (GA) で最適な組み合わせを選ぶ

波長領域選択と異なること 2つのプロセス変数をまたいで時間遅れ領域が選択されないようにする 時間 遅れ 1 ・・・ 60 1 ・・・ 60 1 ・・・ 60 1 ・・・ 60 ・・・ 1 ・・・ 60 プロセス 変数 1 プロセス 変数 2 プロセス 変数 n データ ・・・ 2つのプロセス変数をまたいで時間遅れ領域が選択されないようにする

GAVDSPLSやGAVDSSVRの前に設定すること 選択するプロセス変数の数 いくつかのプロセス変数の数で GAVDSPLS や GAVDSSVR を 行い、モデルの推定性能を確認して適した数を決めてもよい 選択する時間遅れの最大値 ある程度大きくしておけばよい PLS のときの最適成分数、SVR のときの C, ε, γ 遺伝的アルゴリズム (GA) 関係の設定 染色体数、世代数 など

どうやって実際にGAWLS, GAVDSを実行するか? scikit-learn や DEAP を用いて、 GAWLSPLS GAWLSSVR GAVDSPLS GAVDSSVR のデモを行うプログラムを作成しました https://github.com/hkaneko1985/gawls_gavds

注意点 ランダム性があるため、GAWLSPLS, GAWLSSVR, GAVDSPLS, GAVDSSVR を行った結果、いつも同じ結果が得られるとは限らない クロスバリデーションをして推定した結果がよくなるように変数を 選択しているが、モデルがオーバーフィッティングする可能性もある

参考文献 M. Arakawa, Y. Yamashita, K. Funatsu, J. Chemometr., 25, 10-19, 2011 H. Kaneko, K. Funatsu, AIChE J., 58, 1829-1840, 2012 H. Kaneko, K. Funatsu, Chemometr. Intell. Lab. Syst., 121, 26-32, 2013