Scientific Data 6つの原則
Scientific Data は、科学的に貴重なデータセットの記述を掲載する新しいオンライン限定のオープンアクセス誌で、データの共有と再利用を促し、究極的には科学的発見のペースを加速することを目指しています。本誌では、キュレーションによって構造化された研究データの記述を従来の文章による記述と組み合わせた Data Descriptor という新しいタイプのコンテンツを導入しています。
Scientific Data は6つの主要な原則に基づいています。
クレジット
多くの人がアクセスし、再利用ができる貴重なデータセットの作成に力を尽くす研究者には、それに見合ったクレジットと認知が与えられるべきです。Scientific Data には以下の特徴があります。
- 引用可能で、査読を経た Data Descriptor によってデータセット作成に対するクレジットが記録されます。
- 従来の論文では著者資格がない研究者が認知されるようにします。
- 一般公開されているデータセットとそれに関連するコードやワークフローの引用索引を作成します。
- 従来のジャーナルで発表することが難しい貴重なデータセットを発表できます。
再利用
標準化された詳細なデータ記述により、研究データの発見と再利用が促進されます。
Data Descriptor には以下のような特徴があります:
- キュレーションによって標準化された実験メタデータを始め、データの解釈、再利用、再現に必要な情報を提供します。
- データファイル、コード、ワークフローが保存されている1つ以上の信頼性の高いデータリソースへ必ずリンクされます。
- 公開された研究データの再利用可能性が実証され、その認知度が高まるため、研究助成機関のデータ管理関連要件のかなりの部分が満たされます。
- オープンライセンスで公開されるため、改変や二次的著作物の創作ができます。
品質
公開されたデータを真に再利用可能なものとするには、厳しい評価を行って、実験の厳密性と記述の完全性を検証する必要があります。
- 集中的な査読が実施され、Data Descriptor とそれに関連するデータセットの技術的品質と完全性の評価が行われます。
- さまざまな分野の定評ある専門家によって構成される学術的な編集委員会によって基準が保持されます。
- 査読は、関係する実験手法の経験がある1名以上の研究者とデータ規格の専門家1名によって行われます。
- 編集者と査読者は、コミュニティーの基準との適合性を確実に実現します。
発見
研究者は、自らの研究に関係するデータセットを見つけやすくなっています。Scientific Data のコンテンツには、以下のような特徴があります。
- 均一な検索ができ、必要なデータを発見できます。
- 関連するジャーナル掲載論文とデータリポジトリ記録の両方と検証済みリンクが設定されます。
- 全ての Data Descriptor について機械可読版が提供されるので、データマイニングとテキストマイニングがしやすくなっています。
- さまざまなタイプのデータの中から関係するデータセットを見つけやすくなっており、統合的なデータ解析を促進します。
オープン
研究者が他の研究者と連携、協力できる環境を整備すれば、最も成果が挙がります。そこで、Scientific Data は以下の目標を掲げています。
- 実験の方法論、観察、データの収集の透明性を確保します。
- Data Descriptor を通じてデータの発見、共有、再利用を促すことにより科学を加速させます。
- 理解、連携、協力を促進して、学際的研究をはばむ障壁をなくします。
- 全ての利害関係者(研究者、政策立案者、非政府組織、企業、研究助成機関、一般市民)が、それぞれ必要とするデータを見つけ、アクセスし、理解し、再利用できるようにします。
サービス
Scientific Data は、著者と読者の双方に優れたサービスを提供することに尽力します。
- ネイチャー・リサーチ内部でのプロのキュレーションによって標準化されたコンテンツを生成し、均一な検索によってデータを発見できるようにします。
- 著者の皆様は、投稿時に figshare または Dryad にデータセットを登録できます。これによって、利用できるリポジトリがないタイプのデータであっても、データセットの査読を確実、迅速に進められます。
- ネイチャー・リサーチの技術と経験で、個々の研究者と技術者に合わせたインターフェースと組み合わせて、コンテンツの強力な検索、リンク、可視化を実現しました。
- 査読期間を短縮し、Data Descriptor の迅速な公開ができるため、著者の皆様は、時機を逃さずにデータを公開できます。