Nature ハイライト

Cover Story:特集 ビッグデータ:ペタバイト時代の科学

Nature 455, 7209

今週号では、現代科学の前に立ちはだかる最も脅威的な難問の1つ、つまり生まれつつある「データの洪水」についての特集を組んでいる(Editorial/Introduction p.1)。ペタバイト(1015バイト)は、非常に大きなメモリー量といえる。だが、これが「巨大データ」を扱う際の標準的な単位なのだ。Natureでは、サンガー研究所の、ペタバイトの容量をもつスーパーコンピューティング・センターを訪問した(News Feature p.16)。ウィキペディアの成功は、オープンアクセス編集方式という「ウィキ(Wiki)」のコンセプトがどれほどうまく機能できるかを示している。この方式は、現代生物学で生み出される大量データへの対処法としても使うことができそうだ(News Feature p.22)。世界の主要なサーチエンジンであるGoogleが生まれてから、今月で10年になる。11年前には、Googleがこれほど普及すると予想した人はほとんどいなかっただろう。我々は、研究者やビジネスマンに次世代の大物、「ペタバイト時代のGoogle」について予想してもらうという大胆な質問を試みた(Special Report p.8)。デジタルデータは共有が容易だが、同じく容易に消去されたり失われたりもする。オンラインデータをアクセス可能な状態に維持することは、小規模な研究所にとっては特に難しい(Commentary p.28)。Books & Artsでは、F FrankelとR Reidが、ともすれば氾濫するだけのデータの中からデータのもつ意味を見つけ出す方法としてのデータ可視化という考えを擁護している(Books & Arts p.30)。1700年代から1950年代半ばまで、「コンピューター」の役割は人間が務めていた。最も有名なのは、ハーバード大学天文台で1880年代から1940年代まで働いていた、「Harvard computers」と呼ばれる女性たちである。数百万枚の写真乾板に撮像された星を分類するために雇われた「人間コンピューター」の中には、科学に大きく貢献した女性もいた(Essay p.36)。オンライン・データベースは、生物学研究によって生み出される膨大な量のデータの公表に欠かせない手段だが、この種のデータは適切に体系化する必要がある。その役目をするのがバイオキュレーターのはずだが、世界の主要な15のオンライン研究リソースにそれぞれ所属する著者からなるチームによると、バイオキュレーションというこの分野はまだひどく軽んじられているらしい(Feature p.47)。政治レベルでのデータブームの1つは「環境問題」だ。どれだけのデータを集めるかが、どれだけの資金が使えるかに結びつくのである(Party of One p.15)。本特集の関連情報は、オンラインではwww.nature.com/news/specials/bigdata/およびwww.nature.com/podcastに掲載されている。

目次へ戻る

プライバシーマーク制度