Article
RNAの長さによる分別がショートリードRNA-seqデータからのトランスクリプトームの再構築を改善する
Nature Biotechnology 40, 5 doi: 10.1038/s41587-021-01136-7
ショートリードRNA塩基配列解読データから転写物をアセンブリーする方法の正確性は、長距離情報の欠如によって限定されている。本論文では、転写物を長さで分別してから塩基配列解読を行い、追加情報を用いて転写物の定量化とアセンブリーを改善する手法であるLadder-seqを紹介する。シミュレーションデータを用いることにより、Ladder-seqデータを処理するように拡張されたkallistoのアルゴリズムは、従来のkallistoを大幅に上回る正確さで、複雑な遺伝子の転写物を定量化することが明らかになった。リファレンスに基づくアセンブリーでは、StringTie2アルゴリズムに基づく専用のスキームが、それに対応する従来のスキームを30.8%上回る精度で単一の転写物を再構築し、複雑な遺伝子では感度が30%高かった。de novoアセンブリーでは、Trinityアルゴリズムに基づく類似のスキームが、従来のTrinityを78%上回る数のアセンブリーを正確に行い、精度も78%向上していた。実験データにおいて、Ladder-seqはアイソフォームスイッチを有する遺伝子を従来のRNA塩基配列解読法との比較で40%多く見いだし、Mettl14ノックアウトによるm6A減少時のアイソフォーム使用状況の広範な変化を明らかにした。