#scidata16: 再現性を備えた作業は研究者のキャリアを救う
原文: 2 Dec 2016 #scidata16: Work reproducibly for the sake of your career
「自分の実験を他者が再現できるようにすることは、他者を助けるのみでなく、自分のためにもなる。」
再現性は、サイエンスの基本信条のひとつである。ある科学者の成果は、他者により再現できなければならない。さもなければ、その研究結果は偶然の出来事として、あるいは、不正行為として却下される。今日の科学界はデータ主導であり、再現性は単に結果を導き出した手法を意味するものではない。今や多くの科学誌がデータセットやその分析に使用されたコードの公開を要件付けている。この要件により、データと手法の両方を精査することが徹底されるようになった。他の研究者が同一の結果を達成できなかった場合、該当する研究は要注意案件とみなされる。というわけで研究者は欠陥のある研究を発表することによる信用失墜を回避でき、ジャーナルは誤ったサイエンスの出版というリスクを回避できるため、双方に有利な状況が創出される。
それにも関わらず、再現性を備えた作業をしない科学者がいるのはなぜか?
問題は、再現性を備えた研究作業はある程度の時間投資を要するという事実だ。競争の激しい分野で作業する研究者の多くが、時間がないという。ケンブリッジ大学のFlorian Markowetz氏は、かかる主張に反論して、次のように述べている。「再現性のために自分は何ができるかではなく、自分にとって再現性が何を可能にしてくれるかを問いなさい。」
今年10月ロンドンのウェルカム・コレクションで開催された「Publishing Better Science through Better Data」の基調講演で、Markowetz氏は「再現性を備えた研究作業はすべての者に恩恵をもたらす」と説明した。その主張には、「研究者は結論に至った過程を説明できなければならない」という明白な根拠がある。Markowetz氏が言うように、「研究プロジェクトは、美しい成果よりも価値がある。(データを基に最終結論を導いた)過程を説明できないのなら、奇跡が起こったのだ」、ということになる。優秀な科学者は真実性を重視し、奇跡など必要としないはずだ。
自分の手法を理解する必要性を感じているのは、他の研究機関の科学者のみでなく、所属するラボの同僚も情報共有を歓迎するだろう。大学やラボを離れ、別のプロジェクトに移動するとき、自分の研究を引き継いでくれる人をどう確保するかは問題だ。「自分の分析内容を文書化するのを忘れたらどうしますか」と、Markowetz氏は問う。自分が使うコードに解説をつけず、フォルダにフラグを付けていなかったら、使っていたハードドライブを誰かが奥深く調べる必要が生じ、研究が先に進まなくなる。また、自分が再び研究に戻ってきたとき、前回の分析結果をどこに置いたか思い出せない場合も、同じことが起きる。最も効率的に仕事を達成するには、自分の研究作業を継続的にトラッキングすることが重要である。
ここまでの話に納得できない人には、CV(履歴書)の魅力が高まることを説明しよう。担当するプロジェクトのプロセスを文書化し、それをオンラインに掲載することで、自分がそれまで実施したこと、自分の思考プロセス、自分の作業内容と達成事項を他者が閲覧できるようになる。他のデータセットの分析にも活用できるコードを書き込んだのであれば、他の人がそれを利用できるようオンラインで開示しよう。無私無欲といえる行為であるが、自分には何も得るものがないというわけではない。Markowetzと彼のラボが頻繁に行うこととは、「これも自分のCVの一部、ラボの研究成果の一部」なのだ。何百人もの研究者が使用しているツールに感銘しない者はいない。しかもそのツール上に自分の名前があれば、それ相応の見返りを期待できるのだ。
科学者は、キャリアに関係なく、再現性を備えた研究作業を心がけるべきだ。「再現性は、レポーターの場合も重要だ。ある場所からニュースを伝えるときは、真実を伝えなければならない。しかし、他の者が同じ場所にいってレポーターが発見した通りのものを再現できなかったら、そのレポーターは信用を失うだろう。」
自分の実績のひとつについて、それを実施した方法を説明できないなら、CVにある最も印象深い主張も無視されるだろう。上司や(面接先の)企業が疑惑の目を向けるなか、なんとか切り抜けようと説明にしどろもどろになることほど、気まずいことはない。専門分野がなんであろうと、他者のためのみでなく、自分自身のキャリアのためにも、再現性を備えた研究作業を心がけるべきだ。奇跡は起きない。再現性のある研究作業を続ける限り、CVに神の介入を引用する必要はないのだ。
Jonny Page氏は、オックスフォード大学の博士号候補として、同大学で昆虫飛行の生物力学を研究中。他にも、データ科学、プログラミング、科学論文の執筆などに関心を持っている。
「Publishing Better Science through Better Data 2016」では、サイトのスライドと動画へのアクセスを許可しています。また、当日の様子をまとめた映像も提供しています。イベントサイトを参照してください。