九州大学大学院 情報学専攻特別講義 (8) ニューラルネットワークの 離散モデル

Slides:



Advertisements
Similar presentations
2015 年度 有限幾何学 期末試験 次の各問に答えよ.( (1), (2), (3), (4), (5), (7), (8), (10) は答えだけでよい) (1) 有向閉路が存在しない位数 4 のトーナメントを描け. (2) 内点の個数が 10 個の正則 2 分木の葉の個数を求めよ. (3) グラフ.
Advertisements

集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム( 1 ) スケールフリーネットワーク 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター.
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
情報生命科学特別講義III (1) 文字列マッチング
離散システム特論 整列(sorting)アルゴリズム 2.
情報生命科学特別講義III (8)木構造の比較: 順序木
    有限幾何学        第8回.
ファーストイヤー・セミナーⅡ 第8回 データの入力.
    有限幾何学        第5回.
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム(3) + 数理談話会 木構造および画像データの文法圧縮
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
論理式の表現を数学的に取り扱いやすくするために代数学の助けを借りる.
人工知能特論2011 資料No.6 東京工科大学大学院 担当教員 亀田弘之.
データ構造と アルゴリズム 知能情報学部 新田直也.
京都大学 化学研究所 バイオインフォマティクスセンター
京都大学 化学研究所 バイオインフォマティクスセンター
情報生命科学特別講義III (7)進化系統樹推定
奈良女子大集中講義 バイオインフォマティクス (10) スケールフリーネットワーク
生物情報ソフトウェア特論 (1) 文字列マッチング・データ構造
情報生命科学特別講義III (11) RNA二次構造予測
k 個のミスマッチを許した点集合マッチング・アルゴリズム
生物情報ソフトウェア特論 (8) RNA二次構造予測
シャノンのスイッチングゲームにおけるペアリング戦略の複雑さについて
ディジタル回路 3. 組み合わせ回路 五島 正裕 2018/11/28.
3. 可制御性・可観測性.
2. 論理ゲート と ブール代数 五島 正裕.
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
九州大学大学院 情報学専攻特別講義 (9) ブーリアンネットワークの 解析と制御
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
形式言語の理論 5. 文脈依存言語.
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
7.4 Two General Settings D3 杉原堅也.
第14章 モデルの結合 修士2年 山川佳洋.
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
アルゴリズムとデータ構造 第3章 ヒープ 6月10日分
25. Randomized Algorithms
九州大学大学院 情報学専攻特別講義 (3) 配列解析
Data Clustering: A Review
ボルツマンマシンの定義 ボルツマンマシン(Boltzmann machine)は、スピン・システムをヒントに作られたモデルである。
情報生命科学特別講義III (13) 固定パラメータアルゴリズムと 部分k木
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
九州大学大学院 情報学専攻特別講義 (4) RNA二次構造予測
九州大学大学院 情報学専攻特別講義 (6) 固定パラメータアルゴリズムと 部分k木
2016年度 有限幾何学 中間試験 問1 次のグラフを描け.(描けない場合は理由を述べよ) 各20点
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
B03 量子論理回路の 最適化に関する研究 西野哲朗,垂井淳,太田和夫,國廣昇 電気通信大学 情報通信工学科.
データ構造とアルゴリズム (第5回) 静岡大学工学部 安藤和敏
生物情報ソフトウェア特論 (8) RNA二次構造予測
第16章 動的計画法 アルゴリズムイントロダクション.
    有限幾何学        第5回.
Max Cut and the Smallest Eigenvalue 論文紹介
エラー訂正符号を含むシステム CD, DAT, MD, DVD, ディジタルVTR等 ディジタル(衛星)TV放送 ディジタル・セルラ
情報工学概論 (アルゴリズムとデータ構造)
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
情報生命科学特別講義III (14) グラフの比較と列挙
4.プッシュダウンオートマトンと 文脈自由文法の等価性
2017年度 有限幾何学 期末試験 注意:ループと多重辺がないグラフのみを扱う. 問1 次の定理と,その証明の概略を読み,各問に答えよ.
ヒープソート.
生命情報学特論 (6) 固定パラメータアルゴリズムと 部分k木
問2 次の問に答えよ. (ただし,握手補題,オイラーの定理,Oreの定理 は授業で紹介したものとする) (1) 握手補題を書け.
生物情報ソフトウェア特論 (4)配列解析II
生命情報学 (8) 生物情報ネットワークの構造解析
図2 x11 図1 x6 x10 x12 x3 x5 x7 x9 x13 x2 x4 x8 x14 (0,0) (1,0) x1 x15
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
生物情報ソフトウェア特論 (10)固定パラメータアルゴリズムと 部分k木
数理論理学 最終回 茨城大学工学部情報工学科 佐々木 稔.
分子生物情報学(0) バイオインフォマティクス
Presentation transcript:

九州大学大学院 情報学専攻特別講義 (8) ニューラルネットワークの 離散モデル 九州大学大学院 情報学専攻特別講義 (8) ニューラルネットワークの 離散モデル 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター

講義内容 バイオインフォマティクス概論(資料なし) 配列アラインメント 配列解析 RNA二次構造予測 タンパク質立体構造の比較と予測 固定パラメータアルゴリズムと部分k木 グラフの比較と列挙 ニューラルネットワークの離散モデル ブーリアンネットワークの解析と制御 講義の進展状況によっては内容に変更の可能性あり

しきい値関数

閾値関数(1) X1 X2 X3 Y W2 W1 W3 W1×X1 + W2×X2 + W3×X3 ≧ Θ ➡ Y=1 ニューロン(神経細胞)のモデルの一つ 興奮状態=1、それ以外=0 入力の線形和が閾値以上なら1、未満なら0 X1 X2 X3 Y W1 W2 W3 W1×X1 + W2×X2 + W3×X3 ≧ Θ ➡ Y=1 W1×X1 + W2×X2 + W3×X3 < Θ ➡ Y=0

閾値関数(2) X1 X2 X3 Y 2 1 Θ=3 1 2 1 2×1 + 1×0 + 1×1 ≧ 3 1 2 1 2×0 + 1×1 + 1×1 < 3

決定リスト

決定リスト(decision list) 決定リスト: 決定木(decision tree)で木をリストに限定 <(f1,c1),(f2,c2),…,(fL,cL) > という形式で表現 fi は入力変数から 0,1 を返す関数、ci∊{0,1} 左から順に fi を計算し、fi=1 となったら ci を出力して終了 すべて fi=0 なら 0 を出力 1-決定リスト: fi は、リテラルか1 OR: AND:

決定リスト と 閾値関数 定理: 1-決定リストは閾値関数 証明: リストの要素数に関する帰納法 1個の時: 明らか (例: ) 1個の時: 明らか (例:                   ) L個の時(L>1): リストを                とする。帰納法の仮定より                 と等価な         が存在    に応じて閾値関数            を以下のように定義 ただし、 (一般性を失うことなく)ℓ1はx1かその否定、かつ、 i 説明

しきい値関数の個数

閾値関数の個数 n変数ブール関数の個数: 個 Tn = n変数閾値関数の集合 が成立 n変数への 0,1 割り当ては 2n 通り それぞれについて 0/1 を選択可 Tn = n変数閾値関数の集合             が成立 (ここでは、下限は 2n(n-1)/2 のみを証明) ⇒ 閾値関数はブール関数全体より、はるかに少ない AND/OR関数より、はるかに多い x1 x2 x3 f 0/1 1

上限の導出(1) C(N,d): d次元ユークリッド空間において原点を通るN個の超平面により分割される領域の最大数 定理: 証明(帰納法): N=1の時、明らかに C(1,d)=2. N>1の時: N-1個の超平面による分割に、超平面 H を追加 ⇒ H自体はd-1次元 ⇒ H上の分割数は C(N-1,d-1) ⇒

上限の導出(2) 定理: 証明:{0,1}nの要素を u1,…,uN (N=2n)とし、ui’=(ui,-1)とする w1’=(w1,θ1)とw2’=(w2,θ2)が同じブール関数に対応 ⇔ w1’・ui’ と w2’・ui’ の符号が全ての ui’ で一致 よって、異なる閾値関数の個数は、 n+1次元の2n 個の超平面w’・ui’ =0 (w’ がn+1次元上の点に対応)で分割される領域の個数以下 ⇒ ここで、d≦mの時、以下が成立 よって、n>3の場合、以下が成立 (n=1,2,3の時もOK)

下限の導出(1) 定理: 略証(帰納法): n=1の時、明らかに成立. w1,…,wn-1に対して |Tn-1|個が存在。これに wn を追加してどう増えるかを考える(なお、閾値θは常に同じ値) {0,1}n-1 の要素を以下により並び替えたものを x(i) とする wn = -w・x(i)+Δ+θ (i=0,…,2n-1)(Δは小さな正定数)とおくことにより、異なる2n-1+1個の関数を得る。xn=0 の時はもとと同じ、xn=1の時が違う ので よって、

下限の導出(2) 補足: wn を下図右のように変化させることにより、新たに2n-1+1個の異なる関数を得る

しきい値ネットワーク

DNFと閾値ネットワーク DNF(Disjunctive Normal Form, 論理和標準形) ブール関数を[リテラルのAND]のORで表現 任意のブール関数はDNFで表現可能 例1:  閾値ネットワーク: 各頂点(素子)が閾値関数 本講義ではループのない階層型ネットワークのみを対象 定理:任意のブール関数は1層の中間層を持つ素子数2n+1個のネットワークで表現可能 証明:ANDを中間層、ORを出力層として、各関数を閾値関数で表現 例1に対応する 閾値ネットワーク

閾値ネットワークの素子数の下限 (ブール関数に対する)万能ネットワーク(universal network) 定理:万能ネットワークの素子数は 証明:di を i 番目の素子の入次数(入力の個数)とする。 以前の結果より、この素子が表現できるブール関数の個数は よって、N素子のネットワークが表現できるブール関数の個数は 一方、         より         .よって、 定理:中間層が1層の万能ネットワークの素子数は 証明:                         が成立するので、            より、

パリティ関数に対する素子数の下限(1) パリティ関数 PARITYn: x1,…,xn のうち、1となる   変数の個数が奇数個の時に1(偶数個の時は0)   となる関数 定理:中間層が1層、かつ、入出力層間を結ぶ辺が ないネットワークにおいて、パリティ関数計算のため の素子数は 証明: Cnを n次元hypercube とする ({0,1}n の各要素を頂点とし、ハミング距離が1の 頂点間に辺があるグラフ) Cnにおいては辺を通過するたびに PARITYnの値が変化 どの辺も、どれかの閾値関数(に対応 する超平面)と交差することが必要 x1 x2 x3 f 1

パリティ関数に対する素子数の下限(2) 証明(つづき) (簡単のため n は偶数とする) 閾値関数(w,θ)において、一般性を失うことなく wi > 0 とする すると、1となる座標数が n/2 の頂点と n/2-1 の頂点を結ぶ辺すべてと超平面が交差する場合が交差数最大となる(証明略) その場合、交差する辺の個数は Cnには全部で     本の辺があるので、中間層の素子数をN個とすると             よって、 なお、スターリンの公式           より、以下を利用

結論

まとめ 閾値関数が表現できるブール関数: 個程度 任意の n変数ブール関数を表現するための素子数 閾値関数が表現できるブール関数:    個程度 決定リストを含むが、ブール関数全体(   )よりはかなり狭い 任意の n変数ブール関数を表現するための素子数 上限は 2n+1, 下限は パリティ関数を表現する深さ2のネットワークの素子数: 補足 第8回の内容は以下の本に基づく M. Anthony: Discrete Mathematics of Neural Networks – Selected Topics, SIAM, 2001 第8回の内容は古典的な結果が多いが、その後の大幅な改善は少ないと思われる しかし活発な研究が続いており、様々な進展がある(e.g., [Kane & Williams, STOC 2016])