忙しい人のためのR/Bioconductorの基礎 Kashiwa.R #7 (バイオ実験系ラボ支援回) 横山貴央(東大・新領域・情報生命) 2013/3/19
自己紹介 研究テーマ: 特技はRです 東大院 新領域 情報生命科学専攻 D1 ホヤのメチローム解析から探る組織特異的メチル化の起源 特技はRです Tsukuba.R, Tokyo.R, Kashiwa.Rなどで発表 『Rパッケージガイドブック』を共同執筆しました Rの楽しさを伝えるためにやって来ました
これさえ覚えればRは使える! コードを実行する方法を知る コードとその実行結果の保存法を知る 思い通りに行かなかった時の対処法を知る
「Rマンとの約束だ!」 Rはなるべく最新のバージョンを入れておこう http://cran.md.tsukuba.ac.jp/ (筑波大のミラーサイト) Rの統合開発環境「RStudio」もあわせて入れておこう http://www.rstudio.com/ (なぜRstudioも入れたほうがいいかは、このあと説明します。)
最新版はR-2.15.3 http://cran.md.tsukuba.ac.jp/
Rstudio配布サイト http://www.rstudio.com/
Rstudioの起動画面
Rstudioのよいところ テキストエディタのようにコードを書く画面(Source)と、 実行画面(Console)が分けられている 作った変数一覧やコマンド履歴が楽に辿れる プロットの描画、ヘルプの閲覧、ファイルの一覧が 一つの画面内で行える (参考)RGui
">" の右にコマンドを入力する、だけの使い方をしていませんか? コードはなるべくファイルに保存しよう ">" の右にコマンドを入力する、だけの使い方をしていませんか? コマンド履歴で辿れる数には上限がある Source画面でコードを書き、Consoleで実行しよう "~.R"という名前で保存すると、Rstudioで自動で開けるようになる
詳細なTips ヘルプの使い方 データ型とデータ構造を知る 繰り返し処理と条件分岐を理解する 関数の作り方、パッケージの使い方を知る
ヘルプの使い方を知る help.start() というコマンドを実行するとヘルプ画面が起動される。 help(関数名) help(package=パッケージ名) help(データセット名)など
データ型とは 数値 文字列 論理型
データ構造とは vector list matrix (行列) data.frame (列名のついた行列)
matrixやdata.frameの大きさを知りたいときは→ dim() #dimension の略 データ構造を扱う関数 matrixやdata.frameの大きさを知りたいときは→ dim() #dimension の略
(参考)行と列の覚えかた
繰り返し処理 for while apply
関数とパッケージ 関数定義 Source Install.package
Bioconductorとは何か? http://www.bioconductor.org/
Bioconductorでできること RNA-Seqのマッピング結果を可視化&発現変動遺伝子を抽出する http://g86.dbcls.jp/~wakuteka/?p=382
Bioconductorでできること 出芽酵母の一番長い遺伝子を調べる http://qiita.com/items/e9197f8a7b6743107866
Bioconductorでできること ゲノムブラウザーをRのplotで再現する http://qiita.com/items/a99d5fb9f24367f55461
Bioconductorでできること 細胞の核をカウントする http://d.hatena.ne.jp/Rion778/20091210/1260414280
うまく行かなかった時どうするか 教えてくれそうな人のところに聞きに行く 教えてくれそうな人のTwitterに@で聞く Google, seekR や Rjpwikiを調べてみる sessionInfo() を添えるとよいかも 解決策がわかったら、次の人に教えてあげてください
参考資料 R+Bioconductorを使ったNGS解析 1限目「Rの基礎」 (Rで)マイクロアレイデータ解析 http://cat.hackingisbelieving.org/lecture/tohoku-u/NGS-R-Bioconductor-1st.html http://togotv.dbcls.jp/20120925.html (講義動画) (Rで)マイクロアレイデータ解析 http://www.iu.a.u-tokyo.ac.jp/~kadota/r.html (Rで)塩基配列解析(主に次世代シーケンサーのデータ) http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html 統計処理ソフトウェアRについてのTips http://minato.sip21c.org/swtips/R.html