Download presentation
Presentation is loading. Please wait.
1
第17回久留米大学バイオ統計フォーラム 2018/10/05 京都大学(医)統計遺伝学分野 山田 亮
形と分布を 標的表現型にする 第17回久留米大学バイオ統計フォーラム 2018/10/05 京都大学(医)統計遺伝学分野 山田 亮
2
統計遺伝学 『統計遺伝学の基礎』オーム社
3
ゲノム 30億 ATGC 文字列情報
4
オミクス ゲノム 遺伝子情報 30億塩基文字列情報 遺伝子発現 20000遺伝子 細胞ごとの量的情報
ゲノム 遺伝子情報 30億塩基文字列情報 生涯不変 vs. 体細胞変異~1細胞解析 遺伝子発現 20000遺伝子 細胞ごとの量的情報 RNA タンパク質 代謝物 多数の有機化合物 細胞ごと、組織臓器ごとの量的情 報 炭水化物、脂質、タンパク質… いわゆる形質と表現型 個体の特徴 :最終表現型 臓器・組織の特徴:中間表現型
5
DNA/Chromosome modification
DNA,Genome, Consistent Genotype Phenotype DNA/Chromosome modification Transcriptome Intermediate phenotype Protein/Proteome Phenotype/Phenome Phenotypes of Individuals Terminal phenotype
6
オミクス オミクスの層 各層に多数のアイテム 各アイテムに「量的情報」 層ごとにスプレッドシート型データ
7
オミクス解析・マルチオミクス解析 スプレッドシート vs. スプレッドシート vs. スプレッドシート 線形代数的な対象 行列・テンソル…
8
特に興味があるのは、いわゆる表現型 二値:「病気」と「健康」 病気:複雑な諸状態が揃って現れている状態 実数値:身長、血圧、コレステロール値
9
形質・表現型には複雑なものもある 簡単に「0,1」で表せない 簡単に実数値で表せない
10
形質・表現型には複雑なものもある 簡単に「0,1」で表せない 簡単に実数値で表せない
11
形・分布 Mucosal Mononuclear Cells in Flow Cytometry Assay
Quantification of Mucosal Mononuclear Cells in Tissues with a Fluorescent Bead-Based Polychromatic Flow Cytometry Assay. R. Keith Reeves, Tristan I. Evans, Jacqueline Gillis, Fay E. Wong, Michelle Connole, Angela Carville, R. Paul Johnson. Journal of Immunological Methods, Volume 367, Issues 1–2, 31 March 2011, Pages 95-98 Cross-talk between Rho and Rac GTPases drives deterministic exploration of cellular shape space and morphological heterogeneity Heba Sailem, Vicky Bousgouni, Sam Cooper, Chris Bakal Published 22 January 2014.DOI: /rsob
13
何が知りたい? 形そのもの 動きそのもの 形・動きの機能・役割 形・動きのメカニズム どのような形か? どのような動きか? 生物学的意味
形そのもの 動きそのもの どのような形か? どのような動きか? 形・動きの機能・役割 生物学的意味 形・動きのメカニズム 生物物理学 生化学
15
どのように知りたい? 化学 物理 膜の構成成分 細胞質の組成 細胞骨格 運動性分子…
膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 物理 細胞膜の変形性質 細胞質の粘性 細胞外マトリクスの粘性…
16
どのように知りたい? 化学 物理 膜の構成成分 細胞質の組成 細胞骨格 運動性分子…
膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 物理 細胞膜の変形性質 細胞質の粘性 細胞外マトリクスの粘性… これらの諸性質をパラメタとして取り入れたモデルを構築し、 観察データとのあてはまりを調べたり、 パラメタ値の推定をしたりすることはできる
17
生物物理学・生化学的アプローチ どのように知りたい? 化学 物理 膜の構成成分 細胞質の組成 細胞骨格 運動性分子…
膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 物理 細胞膜の変形性質 細胞質の粘性 細胞外マトリクスの粘性… 生物物理学・生化学的アプローチ これらの諸性質をパラメタとして取り入れたモデルを構築し、 観察データとのあてはまりを調べたり、 パラメタ値の推定をしたりすることはできる
18
20世紀は物理学と数学との蜜月 物理学が数学を進め 数学が物理学を進めた 物理学が示すモデルが数学にア イディアを与え
数学が示すこと・ものが、物理 学によって発見された
19
?数学と生物学の蜜月? 生物学が示すモデルが数学にアイディアを与え 数学が示すこと・ものが、生物学によって発見される?
20
?数学と生物学の蜜月? 生物学的な説明はさておき、 データを数学的に処理してみよう 生物学が示すモデルが数学にアイディアを与え
数学が示すこと・ものが、生物学によって発見される? 生物学的な説明はさておき、 データを数学的に処理してみよう
21
データ駆動型 ?数学と生物学の蜜月? 生物学的な説明はさておき、 データを数学的に処理してみよう 生物学が示すモデルが数学にアイディアを与え
数学が示すこと・ものが、生物学によって発見される? 生物学的な説明はさておき、 データを数学的に処理してみよう データ駆動型
22
(純)数理生物学的 アプローチ データ駆動型 ?数学と生物学の蜜月? 生物学的な説明はさておき、 データを数学的に処理してみよう
生物学が示すモデルが数学にアイディアを与え 数学が示すこと・ものが、生物学によって発見される? (純)数理生物学的 アプローチ 生物学的な説明はさておき、 データを数学的に処理してみよう データ駆動型
23
統計解析的には… パラメトリック vs. ノンパラメトリック
モデルがあって、それへのあてはめをする ノンパラ データそのものを、モデルなしに扱う
24
統計解析的には… 教師アリ vs. 教師ナシ 教師アリ 教師ナシ 答えがあって、それを説明するモデ ルを見つける
データそのものを見てパターンを見 つける
25
(純)数理生物学的 アプローチ 生物学的な説明はさておき、 データを数学的に処理してみよう
26
標準化する 形を比較するのは難しい 標準化して比較する すべてを真ん丸にして、 球面上のパターンの比較 をする
27
形 特徴量抽出 恣意性のある 特徴量抽出
28
過不足なく、分解する 数学的に、分解する 正規直交分解 余すところ無く、重なることなく、きれいに分解 主成分分解 フーリエ分解
球面調和関数分解
29
形 → 球面分布 → ベクトル スペクトル分解 データの劣化なき変換
Σ w W: 重み係数ベクトル
30
形 → 球面分布 → ベクトル スペクトル分解 データの劣化なき変換
Σ w W: 重み係数ベクトル
31
完璧に分解できることは確か…、だが 非対称なものを、対称なもので説明するには、無限の要素が必 要
『非対称』・『真平ら』を有限個の『波』の合成で表すことはできない
32
形は 座標系のとり方によらない 同じ形 置かれ方の違い 座標系を定めると、異なる座標を持ってしまい、同じかどうか 解らなくなる
33
回転不変量を 取り出したい 形は 座標系のとり方によらない 同じ形 置かれ方の違い
座標系を定めると、異なる座標を持ってしまい、同じかどうか 解らなくなる 回転不変量を 取り出したい
34
回転不変量を 取り出したい 特別な場合は解けるが… 形は 座標系のとり方によらない 同じ形 置かれ方の違い
座標系を定めると、異なる座標を持ってしまい、同じかどうか 解らなくなる 回転不変量を 取り出したい 特別な場合は解けるが…
35
形 → メッシュグラフ → 行列 各行・各列はグラフの頂点を表す 頂点のつながり具合を表している
各行・各列はグラフの頂点を表す 頂点のつながり具合を表している つながり具合は行・列を入れ替えても変わらない 行・列を入れ替えても変わらないものは、固有値・行列式な ど → 回転不変量・座標系非依存特徴量
36
形も動きも 座標系のとり方によらない
37
座標軸を軌道の上にとる 動標構(Moving Frame)とフレネ=セレ
38
形と動きとを 座標系のとり方によらずに解析する
動標構を基準にすれば、 形に座標系を与えるこ とができる
39
形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 重心の平行移動 + 回転 に分解
重心の平行移動 + 回転 + 変形 に分解
40
形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 回転なしでも説明できる 重心の平行移動 + 回転 に分解
重心の平行移動 + 回転 + 変形 に分解 回転なしでも説明できる
41
形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 回転なしでも説明できる 重心の平行移動 + 回転 に分解
重心の平行移動 + 回転 + 変形 に分解 回転なしでも説明できる
42
形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 回転なしでも説明できる 回転か変形か
重心の平行移動 + 回転 に分解 変形する物体の運動は 重心の平行移動 + 回転 + 変形 に分解 回転なしでも説明できる 回転か変形か 数学で分解するなら 「回転を最大化」「残りを変形」
43
形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 回転なしでも説明できる 回転か変形か
重心の平行移動 + 回転 に分解 変形する物体の運動は 重心の平行移動 + 回転 + 変形 に分解 回転なしでも説明できる 回転か変形か 数学で分解するなら 「回転を最大化」「残りを変形」 分解してみてから考える
44
数学化してから考える 物理学・化学はさておいて、数学処理する 標準化する 分解する 座標系非依存にする 丸くする スペクトル分解・ベクトル化
正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する)
45
数学化してから考える 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 分解する
丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
46
形と分布と 形 空間 閉じた多様体 低次元の閉じた多様体の高次元空間への埋め込み
47
形と分布と 形 分布 空間 閉じた多様体 低次元の閉じた多様体の高次元空間への埋め込み 空間(台) 非負、積分して1 空間は固定
埋め込み方の多様性 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性
48
形と分布と 形を、固定した空間上のパターンにした 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性 Σ w
49
形と分布と 形を、固定した空間上のパターンにした 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性 Σ w
50
形と分布と Σ w かなり近い 形を、固定した空間上のパターンにした 分布 空間(台) 非負、積分して1 空間は固定
空間に貼り付けた関数の多様性 Σ w かなり近い
51
Mucosal Mononuclear Cells in Flow Cytometry Assay
Quantification of Mucosal Mononuclear Cells in Tissues with a Fluorescent Bead-Based Polychromatic Flow Cytometry Assay. R. Keith Reeves, Tristan I. Evans, Jacqueline Gillis, Fay E. Wong, Michelle Connole, Angela Carville, R. Paul Johnson. Journal of Immunological Methods, Volume 367, Issues 1–2, 31 March 2011, Pages 95-98
52
分布にクラスタを見出す 1つの分布標本 複数の分布標本 新たなクラスタを見つけ出したい(探索的) 分布標本間の異同定量がしたい
既知クラスタごとの頻度ベクトルを比較する
54
3クラスタの混合比 → 頻度ベクトル で比較すると、オレンジと青は同じになる それでよい?
56
良くないのであれば… 分布そのものを捕まえる必要がある
57
数学化してから考える 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 分解する
丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
58
数学化してから考える 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 分解する
丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
59
数学化してから考える 混合分布に分解 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する
標準化する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
60
数学化してから考える 自由度 高そう 自由度 高そう 非線形も扱いやすそう 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
物理学・化学はさておいて、数学処理する 標準化する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
61
数学化してから考える 分布には 情報幾何空間がある 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
物理学・化学はさておいて、数学処理する 標準化する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
62
数学化してから考える 分布には 情報幾何空間がある 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
物理学・化学はさておいて、数学処理する 標準化する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
63
複数分布標本のノンパラメトリックな情報幾何空間座標の取り出し
Dataset 1 Dataset 1 Dataset n ・・・ 指数型分布族表現への当て嵌め Dataset n
64
違い(距離)行列を算出 → 内積行列を算出してもよい
標本分布間の 違い(距離)行列を算出 → 内積行列を算出してもよい Inner product matrix Q Sampled Estimate Dataset 1 Dataset n ・・・ Input data
65
Two exponential family
指数型分布族の関数のペアワイズ内積は? Two exponential family 天下り式にポテンシャル関数を定めると 関数内積の対数がθ座標系でのベクトル内積になる
66
・負の固有値を含むので、いわゆるユークリッド空間的にはならないが…
内積行列Mを分解してθ座標を得る 固有値分解 ・負の固有値を含むので、いわゆるユークリッド空間的にはならないが…
67
Θさえ決まれば、あとは線形代数 𝐅 ′ : Θ ′ : F c Set ・P, Θ ψ は観測済み・算出済み ・C, F が未知 Θ
・P は n (samples) x m (grids) 行列 ・P, Θ ψ は観測済み・算出済み ・C, F が未知 F c 𝐅 ′ : Θ 1 Θ ′ : Set
68
ちょっと工夫をしてψ(θ)を変えると実数化できる
・固有値。負の固有値がある i-th eigen value (λi) 虚数を含む表現 実数表現
69
・大きい固有値のみでも、まずまずの復元力あり
・おもちゃデータセットで実験 指数型表現にして分布を再現 標本分布たち ・大きい固有値のみでも、まずまずの復元力あり Top1 Top2 Top3
70
形と分布と 形 分布 空間 閉じた多様体 低次元の閉じた多様体の高次元空間への埋め込み 空間(台) 非負、積分して1 空間は固定
埋め込み方の多様性 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性
71
数学化してから考える 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 分解する
丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.