Article

大規模DNAデータストレージのランダムアクセス

Nature Biotechnology 36, 3 doi: 10.1038/nbt.4079

合成DNAは耐久性があり、デジタルデータを高い密度でコード化することができるため、データストレージの有望な媒体となっている。しかし現在のところ、大規模に保存されたデータのリカバリーでは、情報の一部のみを引き出せばよい場合でも、プール中の全DNAの配列を解読しなければならない。今回我々は、35の異なるファイル(200 MB以上のデータ)を1300万以上のDNAオリゴヌクレオチドにコード化して保存し、個々のファイルがランダムアクセス法によって個別に誤りなくリカバリーされることを明らかにした。そして、DNA中に保存された全ファイルの個別リカバリーを可能とするプライマーの大規模なライブラリーを設計し、その検証を行った。また、全配列リードからの情報を最大化することによって、誤りのないデコード化に必要な配列解読リードのカバー率を大幅に低下させるアルゴリズムの開発も行った。こうした進歩は、DNAデータの保存および検索を行う大規模で現実的なシステムを実証している。

目次へ戻る

プライバシーマーク制度