第17回久留米大学バイオ統計フォーラム 2018/10/05 京都大学(医)統計遺伝学分野 山田 亮

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

第17回久留米大学バイオ統計フォーラム 2018/10/05 京都大学(医)統計遺伝学分野 山田 亮 形と分布を 標的表現型にする 第17回久留米大学バイオ統計フォーラム 2018/10/05 京都大学(医)統計遺伝学分野 山田 亮

統計遺伝学 『統計遺伝学の基礎』オーム社

ゲノム https://www.sanger.ac.uk/science/data/genome-reference-consortium 30億 ATGC 文字列情報 https://psmag.com/environment/why-you-should-be-scared-of-someone-stealing-your-genome-58082

オミクス ゲノム 遺伝子情報 30億塩基文字列情報 遺伝子発現 20000遺伝子 細胞ごとの量的情報 ゲノム 遺伝子情報 30億塩基文字列情報 生涯不変 vs. 体細胞変異~1細胞解析 遺伝子発現 20000遺伝子 細胞ごとの量的情報 RNA タンパク質 代謝物 多数の有機化合物 細胞ごと、組織臓器ごとの量的情 報 炭水化物、脂質、タンパク質… いわゆる形質と表現型 個体の特徴   :最終表現型 臓器・組織の特徴:中間表現型

DNA/Chromosome modification DNA,Genome, Consistent Genotype Phenotype DNA/Chromosome modification Transcriptome Intermediate phenotype Protein/Proteome Phenotype/Phenome Phenotypes of Individuals Terminal phenotype

オミクス オミクスの層 各層に多数のアイテム 各アイテムに「量的情報」 層ごとにスプレッドシート型データ

オミクス解析・マルチオミクス解析 スプレッドシート vs. スプレッドシート vs. スプレッドシート 線形代数的な対象 行列・テンソル…

特に興味があるのは、いわゆる表現型 二値:「病気」と「健康」 病気:複雑な諸状態が揃って現れている状態 実数値:身長、血圧、コレステロール値

形質・表現型には複雑なものもある 簡単に「0,1」で表せない 簡単に実数値で表せない

形質・表現型には複雑なものもある 簡単に「0,1」で表せない 簡単に実数値で表せない

形・分布 Mucosal Mononuclear Cells in Flow Cytometry Assay Quantification of Mucosal Mononuclear Cells in Tissues with a Fluorescent Bead-Based Polychromatic Flow Cytometry Assay. R. Keith Reeves, Tristan I. Evans, Jacqueline Gillis, Fay E. Wong, Michelle Connole, Angela Carville, R. Paul Johnson.  Journal of Immunological Methods, Volume 367, Issues 1–2, 31 March 2011, Pages 95-98 Cross-talk between Rho and Rac GTPases drives deterministic exploration of cellular shape space and morphological heterogeneity Heba Sailem, Vicky Bousgouni, Sam Cooper, Chris Bakal Published 22 January 2014.DOI: 10.1098/rsob.130132

何が知りたい? 形そのもの 動きそのもの 形・動きの機能・役割 形・動きのメカニズム どのような形か? どのような動きか? 生物学的意味 形そのもの 動きそのもの どのような形か? どのような動きか? 形・動きの機能・役割 生物学的意味 形・動きのメカニズム 生物物理学 生化学

どのように知りたい? 化学 物理 膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 物理 細胞膜の変形性質 細胞質の粘性 細胞外マトリクスの粘性…

どのように知りたい? 化学 物理 膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 物理 細胞膜の変形性質 細胞質の粘性 細胞外マトリクスの粘性… これらの諸性質をパラメタとして取り入れたモデルを構築し、 観察データとのあてはまりを調べたり、 パラメタ値の推定をしたりすることはできる

生物物理学・生化学的アプローチ どのように知りたい? 化学 物理 膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 膜の構成成分 細胞質の組成 細胞骨格 運動性分子… 物理 細胞膜の変形性質 細胞質の粘性 細胞外マトリクスの粘性… 生物物理学・生化学的アプローチ これらの諸性質をパラメタとして取り入れたモデルを構築し、 観察データとのあてはまりを調べたり、 パラメタ値の推定をしたりすることはできる

20世紀は物理学と数学との蜜月 物理学が数学を進め 数学が物理学を進めた 物理学が示すモデルが数学にア イディアを与え 数学が示すこと・ものが、物理 学によって発見された

?数学と生物学の蜜月? 生物学が示すモデルが数学にアイディアを与え 数学が示すこと・ものが、生物学によって発見される?

?数学と生物学の蜜月? 生物学的な説明はさておき、 データを数学的に処理してみよう 生物学が示すモデルが数学にアイディアを与え 数学が示すこと・ものが、生物学によって発見される? 生物学的な説明はさておき、 データを数学的に処理してみよう

データ駆動型 ?数学と生物学の蜜月? 生物学的な説明はさておき、 データを数学的に処理してみよう 生物学が示すモデルが数学にアイディアを与え 数学が示すこと・ものが、生物学によって発見される? 生物学的な説明はさておき、 データを数学的に処理してみよう データ駆動型

(純)数理生物学的 アプローチ データ駆動型 ?数学と生物学の蜜月? 生物学的な説明はさておき、 データを数学的に処理してみよう 生物学が示すモデルが数学にアイディアを与え 数学が示すこと・ものが、生物学によって発見される? (純)数理生物学的 アプローチ 生物学的な説明はさておき、 データを数学的に処理してみよう データ駆動型

統計解析的には… パラメトリック vs. ノンパラメトリック モデルがあって、それへのあてはめをする ノンパラ データそのものを、モデルなしに扱う http://speechresearch.fiw-web.net/index.php?FrontPage

統計解析的には… 教師アリ vs. 教師ナシ 教師アリ 教師ナシ 答えがあって、それを説明するモデ ルを見つける データそのものを見てパターンを見 つける https://tjo.hatenablog.com/entry/2014/01/06/190456 https://book.mynavi.jp/manatee/detail/id=87625

(純)数理生物学的 アプローチ 生物学的な説明はさておき、 データを数学的に処理してみよう

標準化する 形を比較するのは難しい 標準化して比較する すべてを真ん丸にして、 球面上のパターンの比較 をする

形 特徴量抽出 恣意性のある 特徴量抽出

過不足なく、分解する 数学的に、分解する 正規直交分解 余すところ無く、重なることなく、きれいに分解 主成分分解 フーリエ分解 球面調和関数分解 https://en.wikipedia.org/wiki/Spherical_harmonics http://enhancedatascience.com/2017/05/07/r-basics-pca-r/ https://en.wikipedia.org/wiki/Fourier_series

形 → 球面分布 → ベクトル スペクトル分解 データの劣化なき変換 Σ w W: 重み係数ベクトル https://en.wikipedia.org/wiki/Spherical_harmonics

形 → 球面分布 → ベクトル スペクトル分解 データの劣化なき変換 Σ w W: 重み係数ベクトル https://matome.naver.jp/odai/2145744163053530401/2145744685158960203

完璧に分解できることは確か…、だが 非対称なものを、対称なもので説明するには、無限の要素が必 要 『非対称』・『真平ら』を有限個の『波』の合成で表すことはできない

形は 座標系のとり方によらない 同じ形 置かれ方の違い 座標系を定めると、異なる座標を持ってしまい、同じかどうか 解らなくなる

回転不変量を 取り出したい 形は 座標系のとり方によらない 同じ形 置かれ方の違い 座標系を定めると、異なる座標を持ってしまい、同じかどうか 解らなくなる 回転不変量を 取り出したい

回転不変量を 取り出したい 特別な場合は解けるが… 形は 座標系のとり方によらない 同じ形 置かれ方の違い 座標系を定めると、異なる座標を持ってしまい、同じかどうか 解らなくなる 回転不変量を 取り出したい 特別な場合は解けるが…

形 → メッシュグラフ → 行列 各行・各列はグラフの頂点を表す 頂点のつながり具合を表している https://www.cs.rpi.edu/~cutler/classes/advancedgraphics/S09/hw1_meshes.html 各行・各列はグラフの頂点を表す 頂点のつながり具合を表している つながり具合は行・列を入れ替えても変わらない 行・列を入れ替えても変わらないものは、固有値・行列式な ど → 回転不変量・座標系非依存特徴量 https://en.wikipedia.org/wiki/Adjacency_matrix

形も動きも 座標系のとり方によらない

座標軸を軌道の上にとる 動標構(Moving Frame)とフレネ=セレ http://hooktail.sub.jp/vectoranalysis/FrenetSerret/

形と動きとを 座標系のとり方によらずに解析する 動標構を基準にすれば、 形に座標系を与えるこ とができる

形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 重心の平行移動 + 回転 に分解 重心の平行移動 + 回転 + 変形 に分解

形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 回転なしでも説明できる 重心の平行移動 + 回転 に分解 重心の平行移動 + 回転 + 変形 に分解 回転なしでも説明できる

形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 回転なしでも説明できる 重心の平行移動 + 回転 に分解 重心の平行移動 + 回転 + 変形 に分解 回転なしでも説明できる

形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 回転なしでも説明できる 回転か変形か 重心の平行移動 + 回転 に分解 変形する物体の運動は 重心の平行移動 + 回転 + 変形 に分解 回転なしでも説明できる 回転か変形か 数学で分解するなら 「回転を最大化」「残りを変形」

形と動きとを解析する 回転か変形か 剛体の運動は 変形する物体の運動は 回転なしでも説明できる 回転か変形か 重心の平行移動 + 回転 に分解 変形する物体の運動は 重心の平行移動 + 回転 + 変形 に分解 回転なしでも説明できる 回転か変形か 数学で分解するなら 「回転を最大化」「残りを変形」 分解してみてから考える

数学化してから考える 物理学・化学はさておいて、数学処理する 標準化する 分解する 座標系非依存にする 丸くする スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する)

数学化してから考える 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 分解する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な

形と分布と 形 空間 閉じた多様体 低次元の閉じた多様体の高次元空間への埋め込み

形と分布と 形 分布 空間 閉じた多様体 低次元の閉じた多様体の高次元空間への埋め込み 空間(台) 非負、積分して1 空間は固定 埋め込み方の多様性 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性

形と分布と 形を、固定した空間上のパターンにした 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性 Σ w

形と分布と 形を、固定した空間上のパターンにした 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性 Σ w

形と分布と Σ w かなり近い 形を、固定した空間上のパターンにした 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性 Σ w かなり近い

Mucosal Mononuclear Cells in Flow Cytometry Assay Quantification of Mucosal Mononuclear Cells in Tissues with a Fluorescent Bead-Based Polychromatic Flow Cytometry Assay. R. Keith Reeves, Tristan I. Evans, Jacqueline Gillis, Fay E. Wong, Michelle Connole, Angela Carville, R. Paul Johnson.  Journal of Immunological Methods, Volume 367, Issues 1–2, 31 March 2011, Pages 95-98

分布にクラスタを見出す 1つの分布標本 複数の分布標本 新たなクラスタを見つけ出したい(探索的) 分布標本間の異同定量がしたい 既知クラスタごとの頻度ベクトルを比較する

3クラスタの混合比 → 頻度ベクトル で比較すると、オレンジと青は同じになる それでよい?

良くないのであれば… 分布そのものを捕まえる必要がある

数学化してから考える 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 分解する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な

数学化してから考える 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 分解する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な

数学化してから考える 混合分布に分解 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な

数学化してから考える 自由度 高そう 自由度 高そう 非線形も扱いやすそう 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な

数学化してから考える 分布には 情報幾何空間がある 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な

数学化してから考える 分布には 情報幾何空間がある 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な

複数分布標本のノンパラメトリックな情報幾何空間座標の取り出し Dataset 1 Dataset 1 Dataset n ・・・ 指数型分布族表現への当て嵌め Dataset n

違い(距離)行列を算出 → 内積行列を算出してもよい 標本分布間の   違い(距離)行列を算出 → 内積行列を算出してもよい  Inner product matrix Q Sampled Estimate Dataset 1 Dataset n ・・・ Input data

Two exponential family 指数型分布族の関数のペアワイズ内積は? Two exponential family 天下り式にポテンシャル関数を定めると 関数内積の対数がθ座標系でのベクトル内積になる

・負の固有値を含むので、いわゆるユークリッド空間的にはならないが… 内積行列Mを分解してθ座標を得る 固有値分解 ・負の固有値を含むので、いわゆるユークリッド空間的にはならないが…

Θさえ決まれば、あとは線形代数 𝐅 ′ : Θ ′ : F c Set ・P, Θ ψ は観測済み・算出済み ・C, F が未知 Θ ・P は n (samples) x m (grids) 行列 ・P, Θ ψ は観測済み・算出済み ・C, F が未知 F c 𝐅 ′ : Θ 1 Θ ′ : Set

ちょっと工夫をしてψ(θ)を変えると実数化できる ・固有値。負の固有値がある i-th eigen value (λi) 虚数を含む表現 実数表現

・大きい固有値のみでも、まずまずの復元力あり ・おもちゃデータセットで実験 指数型表現にして分布を再現 標本分布たち ・大きい固有値のみでも、まずまずの復元力あり Top1 Top2 Top3

形と分布と 形 分布 空間 閉じた多様体 低次元の閉じた多様体の高次元空間への埋め込み 空間(台) 非負、積分して1 空間は固定 埋め込み方の多様性 分布 空間(台) 非負、積分して1 空間は固定 空間に貼り付けた関数の多様性

数学化してから考える 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な 物理学・化学はさておいて、数学処理する 標準化する 分解する 丸くする 分解する スペクトル分解・ベクトル化 正規直交分解も良し悪し 座標系非依存にする 回転不変量・動き自体に乗る(動標構) 位相重視(グラフにして離散情報化する) 線形か非線形か 次元縮約 ノンパラメトリック 無限次元な