Article
複合DNA文字を用いた合成サイクルが少ないDNAデータストレージ
Nature Biotechnology 37, 10 doi: 10.1038/s41587-019-0240-x
DNAはその密度と長期的安定性のため、特にデータの長期アーカイビングに関して魅力的な記憶媒体となっている。既存のDNAストレージ技術では名目上同一の複数分子の合成および配列解読を同時に行うため、情報の冗長性が生じる。今回我々は、複合DNA文字を用いてこの冗長性を利用するコード・デコード法を開発した。複合DNA文字は、配列中のある位置に全4種類のDNAヌクレオチドが所定の比率で配合されていることを表すものである。この方法では、データのコード化に用いる合成サイクルの数が少なくなる。識別可能な複合二分位群による複合DNAに6.4 MBをコード化したところ、単位データあたりの合成サイクルは過去の報告と比較して20%少なくなった。識別可能な複合十分位群によるさらに大規模な複合アルファベットによるコード化のシミュレーションも行ったところ、合成サイクルが75%少なくても十分である可能性が示された。我々は実用性のあるエラー訂正コードおよび推定法を示し、複合DNA文字の文脈におけるエラーのパターンを調べた。