导读
在今年的USENIX安全会议上华盛顿大学的一组研究人员首次证明:可以将恶意软件编码到DNA的碱基序列中。
基因组测序的普及
生命的遗传密码主要保存在DNA序列中,由ATCG编码储存;随着信息技术及计算机技术的发展,全基因组测序与解析已经大大普及;曾经只有在实验室才能用上的测序仪,很多医院也可以用了。特别是像中国的华大基因这样,从最初借助人类基因组计划发展壮大之后,现在更是致力于推动全基因组测序的普及。
一个人的所有编码信息都存储在DNA的序列中,通过这些信息可以了解到每个人的隐私比如遗传疾病、性取向、嗜性等。随着产前诊断的普及,未来将会继续产生大量的个人DNA编码信息数据、也会有更多的计算机及其网络参与其中,如何保护这些数据的安全将会是一个重大问题。
用DNA传播病毒代码
提起计算机我们最痛恨的莫过于计算机病毒,因为它能把你的所有数据曝光于网络。在计算机病毒的防治上我们花费了大量精力;但最新的研究将会加大我们对于信息安全和网络安全的思考。
在今年的USENIX安全会议上华盛顿大学的一组研究人员首次证明:可以将恶意软件编码到DNA的碱基序列中;我们都知道计算机病毒其实是以二进制的01进行编码的,这些编码可以调用计算机的资源和权限进而控制计算机,与其类似的DNA是通过ATCG的碱基配对键进行编码;因为AT配对会形成两个共价键,而CG配对会形成3个共价键,这就是计算机测序记录的基础。将这些配对进行合理的设计就能把恶意编码编写进DNA序列中。这样一旦测序仪将DNA序列转化成计算机能识别的编码后病毒就完成了传播;这个过程就相当于一个带有恶意程序的U盘被查入一台正常计算机一样----DNA将成为另一个恶意程序传播的介质。
科幻黑客
这就有点像黑客帝国里男猪能看到人体内流动的代码一样;这种科幻黑客将在不久后成为现实;该研究项目的负责人Tadayoshi Kohno表示:“如果一个对手控制着一台计算机正在处理的数据,那么它可能会占用这台计算机,”传统的黑客攻击,只是在网页或电子邮件附件中打包恶意代码。“这就意味着当你在考虑计算生物学系统的安全性时,你不仅要考虑网络连接,USB驱动器和键盘上的用户,还要考虑在DNA中存储的信息。这是关于考虑不同类别的威胁。
由于遗传测序越来越多地由集中式服务来处理,通常是具有昂贵基因测序仪器设备的大学实验室或大型测序公司;这类型的机构往往存储了大量有价值的数据。随着DNA传播恶意软件变得越来越现实,这类机构的数据安全应该提前进行相关的防护。
研究人员表示:通过DNA传播的恶意软件将可以盗取大量有价值的数据或者直接修改测序结果或者已有数据,造成巨大损失;但这项技术也有正面的使用方式,比如在自己知识产权的转基因产品的DNA中加入这类“病毒DNA”可以保护公司的商业机密。
可能的技术难点
1、 如何保持代码的完整性;
研究人员首先编写了一个名为“缓冲区溢出”的漏洞,其作用是填补计算机内存的空间迫使一些数据泄露到其他内存中去生成自己的恶意指令。但目前在DNA上编写一个这样的攻击代码是非常困难的;因为在实际测序中会将数百万个基础的图像分成数千块,然后进行并行分析。所以,实际编写中只能将代码编写在几百个碱基中,以保持代码在系统中的完整性。
2、 如何在维持DNA正常结构的情况下编入恶意代码
自然中的DNA是相对稳定的。这主要是因为其中所含的AT和GC比列比较均衡,不会出现大段的重复或者缺失。而缓冲区溢出代码中含有重复数据串,这会导致DNA链的自身折叠、进而加大测序时的难度。
解决办法--利用系统漏洞
利用测序过程中使用的软件的漏洞,通过对存储DNA序列的文件FASTQ进行压缩,使其变为fqzcomp-FASTQ文件;当数据被测序系统记录后fqzcomp-FASTQ会自动解压出FASTQ恶意代码并使其执行从而攻击测序计算机和其网络。(其利用了fqzcomp程序中的漏洞)
更多研究及未来正面意义的应用
日前已有哈佛大学的研究人员将一段视频编写进一个DNA编码中;对DNA编写的研究更多的是如何将DNA转换成一个存储介质,这将比现有的磁性存储介质保存的时间更长。    
参考资料来源:《Science》
作者:Stem Cell
投稿、授权、合作事宜请联系[email protected]
或微信ID: yikexue2015
长按二维码识别,可以关注/进入公众号进行回复。
点击“阅读原文”,打开科学大门
继续阅读
阅读原文