海归学者发起的公益学术平台
分享信息,整合资源

交流学术,偶尔风月
2017年,黄岩谊课题组将通信理论中的纠错码引入到测序技术中,通过三条正交的简并序列来检测并校正测序错误。这项“纠错码测序技术”兼具较长的读长和极高的准确度。近日,该课题组又在《国家科学评论》(National Science Review, NSR)发表文章,通过计算机模拟构建的“虚拟测序仪”,揭示了纠错码测序技术中“失相”问题的模式、特征,并在此基础上建立了一个失相校正算法,为更加高效、准确的测序技术提供了一种实用解决方案。
高通量测序中的“失相”问题 
近二十年来,新一代高通量测序技术快速发展,极大地改变了生命科学和医学研究,并迅速进入医学诊断等领域,服务于健康产业。
当前主流的高通量测序技术大多采用“边合成边测序”的方式,且会将每一条待测DNA分子扩增成多条DNA组成的簇,从而放大可检测信号。理想情况下,一簇DNA中的每个分子在测序过程中都是同步的,所以周期性反应所获得的测序信号就直接反映出待测DNA的序列信息。
然而,在真实的测序体系中,各个分子间从来都不是完美同步的。由于反应不完全或者反应体系中杂质引起的副反应,一簇DNA中的各个分子会逐渐失去同步性,反映到测序过程中,就会使测序信号变得紊乱,而无法直接反映DNA的序列信息。这一现象称为“失相”即分子间信号“相位”的失谐。失相问题极大地限制了高通量测序的读长和准确性。
每一种基于类似原理的测序方法,都存在这样的现象。而在使用不同化学反应的不同测序方法中,失相现象的特征也不尽相同。如要创建新的测序技术,对其失相现象的充分理解是一个必须解决的主要问题。
“纠错码测序”中的失相模式 
为了提高测序技术的准确性,北京大学黄岩谊课题组于2017年将通信理论中的纠错码引入到测序技术中,通过三条正交的简并序列来检测并校正测序错误。这一项纠错码测序技术兼具较长的读长和极高准确度的潜力。
纠错码测序中也有失相问题。近期,黄岩谊课题组通过计算机模拟,构造了一个“虚拟测序仪”,来研究纠错码测序方法中失相问题的模式、规律,并探索解决方案。
研究者发现,“单碱基滑动”是纠错码测序独有的失相模式在纠错码测序中,杂质引起的副反应会使DNA分子发生额外的延伸反应,称之为初级超前反应。若初级超前反应仅延伸一个碱基,则该DNA分子会立刻被过量的底物进一步延伸,称之为次级超前反应;而若初级超前延伸了不止一个碱基,则上述次级超前反应不会发生。即,次级超前反应发生的条件可以被归纳为单碱基滑动。
利用“虚拟测序仪”,研究者探索了DNA分子在不同反应条件下的延伸规律,找到了影响单碱基滑动的关键因素。依据单碱基滑动这一失相模式,作者还建立了一个失相校正算法,并证明该算法可用于校正至少500轮的测序反应(对应1000 bp的测序读长)。
最后,作者还将失相校正算法推广到了具有更高准确度的双色纠错码测序上,并在实际测序中进行了验证。
“单碱基滑动”这一新型失相规律的发现和归纳,不仅仅对“纠错码测序方法”提供了更加深刻的理解,同时对于如何更加快速高效地实现对测序化学反应信号的解读和推算,提供了一个实用的解决方案。
点击“阅读原文”查看论文原文。
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方
继续阅读
阅读原文