草根影响力新视野 翻译 钟艺
图 Getty Images/iStockphoto
现在的我们身处数据驱动型社会,在不断追求数据化的进程中,我们也正在寻找能比传统存储技术处理更多信息的解决方案,因此科学家将目光转向了来自大自然的强大数据储存器:DNA。根据最新发布的《科学》杂志,哥伦比亚大学和纽约基因组中心的一对研究人员写了一个完整的计算机操作系统、一个1895年的法国电影、一个亚马逊礼品卡和其他文件进入DNA链,并检索出所存储的信息没有发生存储错误。
使用DNA进行存储有以下几个优点。首先,它比传统存储媒介小得多。一单克DNA可以比一千兆硬盘驱动器多承载215000倍的数据。其次,它有著令人难以置信的耐用度。比如,科学家正在用数千万年前的DNA来还原早已灭绝的长毛勐犸象。尽管如此,目前科学家也只是解锁了DNA存储容量的很小一部分。联合研究者Yaniv Erlich和Dina Zielinski受到电影在网络中传播的启发,发现了一个新的方法以最大化的利用每个核苷酸的理论最大信息量。
“我们将文件的比特映射到DNA核苷酸中,然后,我们合成这些核苷酸并将分子存储在试管中,”Erlich在接受ResearchGate采访时解释说。“为了检索信息,我们需要对分子进行测序。这是一个必经的基本过程。为了收集信息,我们设计了一种称为DNA喷泉(DNA Fountain)的策略,这个策略来源于编码理论中的数学概念。正是这种策略使我们能够实现对数据的最佳收集,这也是研究中最具挑战性的地方。”
当像Netflix这样的在线流服务发送信息时,它使用喷泉码,它将数据分割成小包。即使几个数据包丢失,Netflix可以重建整个信息流(注释:Netflix是一家美国公司,在美国、加拿大提供因特网随选流媒体播放,定制DVD、蓝光光盘在线出租业务。)。DNA有类似的问题, 科学家只能小批量地创建和排序它。 这意味著有大量的数据需要被分解,并且在这个分解的过程中它们的比特可能丢失。 DNA的另一个缺点是什么呢?DNA在测序后会分解,这意味著又会有更多的信息丢失。 幸运的是,DNA很容易复制,这从一定程度上减弱了DNA的缺陷。
虽然像微软这样的公司目前正在寻找DNA作为存储的又一个便捷途径,但Erlich估计我们依旧需要十多年的不断研究和尝试,才能使DNA存储成为主流。“我们还处在DNA存储研究的早期,但我们也是在对磁性媒介进行了多年的研究和开发之后,才使磁性媒体真正发挥了存储的作用。”
Polygon recent comments