Data Matters:データの重要性 │ クレジットと品質
原文: 15 July 2014 Data Matters: Interview with Kaylene Simpson
Kaylene Simpson氏はオーストラリア Peter MacCallum がんセンターのRNAiスクリーニング施設である Victorian Centre for Functional Genomics でセンター長を務めています。
あなたの分野でのデータの取扱いについてどのような経験がありますか?
私は初期のころからRNAiスクリーニングを行ってきました。そして私たちが2008年にスクリーニングについて論文を発表した際には、解析データや画像、経時的な情報を見られるようなレポジトリを構築しました。それはまさに特注品で、自分たちに特化したものでした。私はデータをオープンにできないようなスクリーニングを行うのは意味がないという熱い思いを常に抱いてきました。人々がデータをいかに得たかを理解できるようにする必要があります。これらのスクリーニングは非常に重要で、データがさまざまな方法で解析され新しい情報に照らして再解釈できるように広く公開する必要があります。また、スクリーニングがどう行われたかを厳密に技術的な面からわかるようにする必要があります。
私はスクリーニングに加わったり、何年も費やしているような人々を見たりします。彼らはターゲットのリストとともに博士課程を終わらせるかもしれないし、博士課程に在籍したままかもしれない人々で、時には充分な機構研究を行えずに成果を発表するに至らないこともあります。ポスドクは技術的な詳細にとても情熱を傾け、そして実験条件をちょうどよく調整します。彼らはやってきたことに誇りを持っているのです。しかし最後はちょっとしたむなしさを感じています。というのもやってきたスクリーニングの仔細についてまで発表できる手段がないからです。
私はデータをオープンにできないようなスクリーニングを行うのは意味がないという熱い思いを常に抱いてきました。
我々は昨年、論文を発表し、すべてのデータをPubChemに登録しました。私の施設のリーダーとしての原動力は公共レポジトリへの登録率がユーザーの約90%に達することです。確かにScientific Data にすべてのスクリーニングを発表するわけではないけれども本当にユニークなものについてはここで発表したいと考えています。私はそこにアクセスし生データを得られるようなレポジトリの考えに賛成です。生データについて、レポジトリでその内容をすべて記述することもできます。私たちは常にMIARE(RNAi実験における最低限の情報に関するガイドライン)とともに仕事をしています。そして研究室のほとんどのユーザーがさまざまな論文に概して supplementary の情報としてMIAREスタイルのドキュメントを投稿するでしょう。RNAi分野内で我々が今までに直面した最も大きな問題のひとつはスクリーニングを完全に解釈できるように十分かつ適切な詳細つきで論文を提供することです。それはたとえ研究者にMAIREドキュメントを埋めさせるのが難儀に思われてもです。Scientific Data はこのような問題を解決する手助けをしてくれます。
あなたの分野でのデータの所有と共有の文化の広がりはどのようなものでしょうか?
自身でスクリーニングを行う生命科学者の私たちにとって、真のデータの所有者はほんの数人の人々です。
プロジェクトを運営するアカデミックなグループリーダー、実際にスクリーニングを行ったひとりかふたりの科学者、そしておそらくすべてにおいて特別な生物学的な解析を行う何人かの他の人々やバイオインフォマティシャンの参画があるでしょう。ですので、まだ小さなチームなのです。
絶対的に何も共有しない、そしてデータを外部におくことに被害妄想をもった研究室がいくつかあることは疑いないことです。しかし、私はよりよい仕事をするために必要なことだととらえています。取り組めるのには限りがあるのですが、彼らとの議論は5年後に戻ってくるかもしれないだろうものです。Scientific Data にスクリーニング結果を投稿した私の学生はすべての実験を公のものにでき、他の研究者がそこから多くを得ることができるというアイデアに非常に興味を持ってくれました。スクリーニングをするのに非常に長い時間をかけるとあなたも熱心になるでしょう。これは論文の最終的なターゲットについてだけでなく、データの金脈を共有することになるのです。
データは埋もれさせるべきではありません。私たちは非常に大量な時間とお金を投資しています。そして車輪の再発明をさせるべきではありません。
オープンデータのエコシステムの中でScientific Data はどういう働きを担うことができるでしょうか?
私は高スループットの分野内で絶対的に必要不可欠なものを満たすものとしてScientific Data を見ています。Scientific Data のような何かによってデータをすべてオープンかつ包括的に共有できるようにする、というのは長年の懸案でした。データは埋もれさせるべきではありません。私たちは非常に大量な時間とお金を投資しています。そして車輪の再発明をさせるべきではありません。PubChemやスクリーニングデータへのリンクはありますが、どのようにスクリーニングが行われたかの詳細な記述はありません。これはいくつかのターゲットについての詳細な機構についての手がかりだけでスクリーニング結果を論文にさせることによって我々が失う重要な点です。私たちは何がこのスクリーニングを可能にしているかの全ての情報を失っているのです。
Scientific Data はNPGのジャーナルですから、人々が注目します。私はScientific Data すべての記述的なリソースを与えるための主力ジャーナルになっていくことを期待しています。とめどなく殺到する投稿原稿を抱えるだろうことを想像しています。こういうことに関わりたい多くのスクリーニング施設が存在していて、私はRNAiと化合物スクリーニングに関する自分の認識から話しているにすぎません。いかに彼らがデータを解析してきたかを示し、画像を登録するのを本当にやるべきハイコンテントスクリーニングのイメージングの世界が存在しているのです。このことは新しい問題を生んでいます。Scientific Data は我々の研究室からの片手ではおさまらないようなスクリーニングを発表したがるでしょうか。もし論文がScientific Data に受け入れられてもらえないなら、現在のところこのような規模でデータを受け入れてくれる他のジャーナルはありません。
インタビューアー:David Stuart(英国ロンドンを拠点に活動するフリーランスライター)
See the Data Descriptor by Kaylene Simpson and coauthors
Genome-wide functional genomic and transcriptomic analyses for genes regulating sensitivity to vorinostat
Falkenberg, K. J. et al. Sci. Data 1:140017 (2014).