シャコ・エビ日記

シャコパンチ、エビパッチン研究者の記録

論文編集の方法:効率よく論文を書くための今後の作戦

論文が,研究者の仕事の主な成果となる.この成果を出して行くのに効率のよい合理的な方法を模索する.工夫をしないと作業数は増えてしまうし,作業数が増えればそれだけミスも増える.作業数を減らさないといけない.編集作業をどうやって工夫するか? 生データがすでにあり,解析し,投稿原稿を作成するところまでをどうやってやろうか,これから何を導入して,どうやってこれまでの問題を解決しようかを考えながら,今後の作戦を練ってみた.すべてフリーなツールを用いる.テキストベースの編集は,Git & Latexを用いて行ない,図版はR,Tgif, Gimp, ImageJを用いて編集作業をする,というものだ.

増大する作業数

先日論文の再投稿をしたが,初稿を書いてから投稿,編集を繰り返して一年以上かかっている.この編集作業は,各ジャーナルの投稿規定にしたがったものになる.規定が違えば,そのたびに図版や論文の形式をかえることになる.規定に合わせながらあちこちを書き換えるので,変更作業数x変更作業数x...と,作業数が増えてしまう.


変更するたびにファイルを保存はしていた.しかし,問題があって,ある部分だけを以前のバージョンにしたいとなったときに,別の部分で整合性がとれなくなったり,なぜ今このように変更したのかの履歴がないとしばらくすると忘れてしまっているので,その理由がわからなくなったりする.


自分ひとりの作業ですらこうで,ボスとのやりとりで変更が加わるとますます混乱する原因が増える.こうした困難はどこでも日常的に起きていることだろう.こうした作業数を減らして,ラクにしたいものだ.

バージョン管理ツールGit

そこで,バージョン管理ツールが使えば,編集がラクになるのではないかと考えた.そうしたツールいくつかあるようだが,Gitというのを最近よく耳にする.こうしたツールは,もともとソフトウェアを複数人でつくりあげるためのツールで,こうした問題解決のために開発されたものだ.論文書くようなときに生じる問題は似ている.

Git(ぎっと)はプログラムなどのソースコード管理を行う分散型バージョン管理システム。動作速度に重点が置かれている。Linuxカーネルのソースコード管理を目的として、リーナス・トーバルズによって開発された。現在のメンテナンスはJunio C Hamano(濱野純)が担当している。

Git - Wikipedia


メンテナンスをしているHamanoさんによる本が出ていたので,購入した.本にしたがい,設定した*1

テキストベースな編集作業

Gitを利用するには,プログラムのソースコードのようにベタテキストの編集にしないといけない.


すると問題は,これまで用いてきたMicrosoft Wordである.Wordでは,プログラムのソースコードと同じようには編集作業の管理ができない.学位論文であれば,自分でできるので,Latexで原稿を書いて行くことにした.Latex関連書籍としては,「Latex2e 美文書作成入門(奥村晴彦)」が参考になる.


Git & Latexでテキストベースな作業をやっていこうというわけだ.普段からテキストの編集作業はEmacsを使っている.MacOSXを使っているので,Carbon Emacsがおすすめだ.Emacsであれば,プログラミング環境をととのえるのにもよい.


たとえば,統計解析を行うときにRを使うには,Carbon EmacsではESSが最初から入っているので,.emacsファイルに(require 'ess-site)と記入して,M-x RとするとCarbon EmacsからRが起動できる.図版もRでかなりの作図ができる.Rはすぐれたデータ解析環境である.


最近,Kuboさんが翻訳を終えた「Rグラフィクス」で紹介されているgridパッケージとLattice,あるいは,ggplot2*2などを使えば(修練すれば),高品位なグラフが描ける.作図しつつプログラミングできる.また,データの解析&作図を行うプログラムはテキストベースの編集なので,Gitで管理できる.

Tgif & Gimp & ImageJ によるアートワーク

テキストベースでできない部分,お絵描きを含めた図版づくりだ.これまではad*be製品を使っていた.とても強力なソフトではあるが,自分の非力なコンピュータには重すぎる*3.ライセンスの問題もある. Open Office のDrawかTgif*4 を用いる.画像についてはGimpを用いる.顕微鏡写真を扱うのには,ImageJを用いる.

*1:MacPortsでエラーが出たので,探すとOSX用のインストーラーがあった > http://code.google.com/p/git-osx-installer/

*2:ともにgridがベースで開発されたパッケージであるが.

*3:先日IllustratorPowerbookG4 867に入れようとしたら,メモリが1G必要だと文句言われた.

*4:Inkscape のほうがいいかもしれない.http://www.inkscape.org/