シャコ・エビ日記

シャコパンチ、エビパッチン研究者の記録

「Rを教えるにあたってのクイック・ガイド」

イメージングのデータをよりによって,エクセルで,カット・アンド・ペーストを繰り返し,徹夜して解析している4年生を見て,こりゃいかんと思い,Rのスクリプトを書いて,「ほら,こんなに作業が簡単になるでしょ?」と,Rをオススメするはずだった.

ところが,反応はイマイチ.こんな難しいことやってられません,と言いたげな顔になってしまったので,いきなり負荷をかけすぎたかと反省.やはり,教えるのってムズかしい.

ヤマほどR関連のドキュメントがインターネットで自由に手にはいるようになってきたが,それでも,直面している問題にすぐ答えてくれるわけでもなく,じっくり学んでいく必要があるのがほとんどだ.情報が多すぎて,すぐに自分の問題の解決に役立つことが少ない.

ちょっとプログラムが書けると生産性がぐんと上がることは多々ある.生物学では,データ解析は必須であるから,統計解析環境のRはもってこいだ.しかし,そういう講義が,たとえば,自分が今いる生物学科ではない.統計学の講義すらない.けっこう由々しき事態だと思っている.

そんな折,Computational Biologyの生徒対象とは書いてあるが,教えるにあたってのクイック・ガイドがあった.

A Quick Guide to Teaching R Programming to Computational Biology Students
Stephen J. Eglen

PLoS Computational Biology: A Quick Guide to Teaching R Programming to Computational Biology Students

本文にもあるが,Rを習得するのに一番いいのは,各自が直面している問題セットに対して解析プログラムを書いて,図示し,文書にまとめることだ.Rは,出版論文に到達するまで,ずっと役立ってくれる.実際,僕もデータのマイニングから,統計解析,論文用の図版まで,かなりの部分をRでやってきた.しかし,独力では,最初のしきいが高い.落とし穴もたくさんある.このガイドではそんなとき役立つポイントが小さくまとまっていた.

オススメされていた本

ページ数のできるだけ少ない本がオススメされていた.

Introductory Statistics with R (Statistics and Computing)
Introductory Statistics with R (Statistics and Computing)
自分は持ってる.古典的な統計解析に役立つ.翻訳も出てる.

A First Course in Statistical Programming with R
A First Course in Statistical Programming with R
自分は持っていないけど,プログラミング中心で,よさそう.

S Programming (Statistics and Computing)
これは,すでに(他の言語でも)プログラミングの経験があるような,上級者向け.この7月に新しい版が出るようだ(と思ったけど,そうは書いてない.同じかもしれない).

R Graphics, Second Edition (Chapman &Hall/CRC The R Series)
R Graphics, Second Edition (Chapman &Hall/CRC The R Series)
北大の久保氏による翻訳 Rグラフィックス ―Rで思いどおりのグラフを作図するために― が出ているが,原著の第二版が出ていた(今日,注文した).

役に立つと紹介されていたサイト


Rという一文字の名前ゆえの検索のしにくさから生れた,R関連のドキュメント検索サイト.

RSeek.org R-project Search Engine


Rのグラフィクスの具体例とコードが集められているサイト.

R Graph Gallery __ Home-1

あと,MatlabユーザーのためのRのサイトが紹介されていたが,アクセスできなかった(2011/7/4)*1

Rを学ぶ上で直面するよくある問題

文法エラーととっかかり.Rの文法は生徒によっては,難しくて,時には簡単な問題に対して,数時間をデバッグにかけたりする.そんな時は,筆者は周囲に助けを求めるように言っている.あるいは,wikiを使って質問させ,tipsを交換したり,コードの例を共有するように勧めている.しかし,やはり,基本的でよく使うRの関数などは,講義や本などで体系的に学ぶのがいいだろう.

その他,「前もった変数の割り当て」「ベクトル化」「ベクトル化問題の例」「データ・タイプ」については,また,おいおい(ってここが大事なとこなんですけど、エネルギー切れ).

*1:http://germain.its.maine.edu/~heibeler/comp/matlabR.html