将数据存储到身体?下一代的存储容器也许会是DNA。

电子说

1.2w人已加入

描述

目前我们正处于数据爆炸增长的时代,像硬盘、内存芯片等数据存储容器已经出现“负荷过重”的迹象。现今看来,要想将全球数据存储起来似乎技术还远远没达到这个水平。但是,最近有研究发现一种新的数据存储方式——DNA 数据存储。

其实,这种存储方式的研究早已进行中了。

去年年底,法国一位16岁高中生Locatelli将《古兰经》和《圣经》中的部分内容存储到DNA中并注入到自己的体内。他把希伯来语和阿拉伯语的字符转换成DNA碱基的特定组合,将转换后的DNA链移接到购买的病毒上,最后用注射器将病毒注入自己的大腿 。

从逻辑上来讲,实现这项目标并不难。Locatelli 首先用一个基本的系统将文本翻译为构成 DNA 的核酸。

在圣经《创世纪》中,他将22个希伯来字母转换成四种可能的核酸:胞嘧啶、胸腺嘧啶、鸟嘌呤或腺嘌呤。胞嘧啶和胸腺嘧啶分别代表五个字母,鸟嘌呤和腺嘌呤分别代表六个字母。

在阿拉伯语文本中,Locatelli 去掉了 28 个字母中的 5 个,并给了其中 3 个独特的核酸,允许 Ra 和 Sad 共享胸腺嘧啶。在这两种情况下,Locatelli 都忽略空格、标点符号和变音符号。

然后,他分别从VectorBuilder和ProteoGenix公司购买了定制的DNA链,以及用于将新DNA插入细胞的良性病毒。他买了一些生理盐水和注射器就出发去参加了比赛。注射后,他只出现了轻微的过敏反应。

但是,加州大学洛杉矶分校的生物化学家Sriram Kosuri表示,他不能确定Locatelli的方法是否真的有效; 也无法评估病毒载体是否成功地将合成的DNA导入Locatelli细胞。

除了这位高中生的研究成果外之外,最近,一家位于波士顿的初创公司Catalog宣布,他们成功将维基百科英文版一共16G的文本内容存储在了一个DNA分子上!

一个DNA分子即可轻松存储16g内容

计算机存储容器已经从带磁铁的电线变成硬盘,如今发展到3D存储芯片。为了追求更小占用空间却有更多的存储空间,下一代存储容器也许会回溯到与地球上的生命一样古老的方法:DNA。

企业Catalog近日宣布,他们将维基百科英文版的所有文本一共16G的内容存储在了一个DNA分子上!

Catalog用它的第一个DNA书写器完成了这项壮举。

这个DNA书写器有多大呢?大小大概与一辆现代 SUV 差不多。尽管它目前看起来不太可能可以有机会打倒手机的存储芯片,但Catalog认为,它对一些需要将数据存档的客户来说已经很有用了。

DNA链虽然很小,也很难管理,但是生物分子可以存储在除了控制细胞如何发芽或为什么猩猩会是猩猩的基因外的其他DNA区域。Catalog使用了比人类DNA短但更多的预制合成DNA链,因此它可以存储更多的数据。

可能听起来像是倒退,但DNA是紧密的,在化学上以稳定的形式存在,同时由于它是地球生物学的基础,可能不会像硬盘驱动器或CD那样过时,也不会像软盘驱动器那样被市场淘汰而消失。

由于传统的DNA测序产品已经在生物技术市场上销售,可以以此读取DNA数据。研究人员认为“这一全新的序列技术用例将有助于(大大)降低成本”,Catalog认为DNA存储方式在计算业务中潜在一个巨大市场。

Catalog也使用了寻址系统,这意味着当DNA以长序列存储数据时,也可以使用分子探针读取存储在任何地方的信息。就是一种硬盘一样的随机存取存储器,而不是像半个世纪前大型计算机鼎盛时期的磁带盘那样的顺序存取。

有人会认为DNA会被射线破坏,但 Catalog 认为它是一种比其他方法更稳定的介质。毕竟几千年前灭绝动物依然能发现其DNA。

DNA存储数据有什么意义?

《科学美国人》与世界经济论坛联合发布了 2019 年全球十大新兴技术,其中一项就是用 DNA 储存数据。那么,DNA存储数据的意义何在呢?

据软件公司Domo称,在2018 年,谷歌每分钟都有388 万次搜索、YouTube被观看的视频有433万个、有159362760封电子邮件被发送、推特有47.3万条,在 Instagram上也发布了49000张照片。

预计到2020年,全球人均每秒将产生大约1.7兆字节的数据,假设世界人口为78亿,一年就会产生约418个 zettabytes。如果放在容量为1TB的硬盘上,则需要4180亿个!

这种情况下,目前的数据存储系统根本撑不过一个世纪。此外,运行这些数据也需要消耗大量的能量。因此,我们将面临一个严重的数据存储问题,并且随着时间的推移,这个问题只会变得越来越严重!

所以硬盘存储的一种替代方案——基于DNA的数据存储才显得尤为重要。由核苷酸A,T,C和G的长链组成的DNA 序列是生命的信息存储材料。数据可以按照这些字母的顺序存储,从而将DNA转变为一种新的信息技术形式。

目前DNA已经可以常规排序(读取),合成(写入)并且可以轻松准确地复制。DNA本身结构也是非常稳定的,正如生活在50多万年前的化石马的完整基因组测序所证明的那样,存储它不需要太多能量。

另外,DNA的存储容量是让人惊讶的。DNA可以以远超过电子设备的密度精确存储大量数据。例如,根据哈佛大学George Church及其同事2016年发表在“Nature Materials”杂志上的计算,简单的大肠杆菌的存储密度约为每立方厘米1019比特。

在这样的密度下,仅仅需要一个边长约一米的DNA立方体便可很好地满足全世界一年的数据储存需要,简单来说就是1kg DNA就能储存全球数据。

内存芯片

DNA 数据存储的前景不仅仅是理论上的。例如,2017 年,哈佛大学的Church小组采用CRISPR DNA编辑技术,将人手的图像记录到大肠杆菌的基因组中,并以高于90%的准确率读出。华盛顿大学和微软研究院的研究人员已经开发出一个完全自动化的系统,用于编写、存储和读取 DNA 编码的数据。包括微软和Twist Bioscience在内的一些公司正在致力于推进 DNA 存储技术。

与此同时,DNA已经被研究人员用来以不同的方式管理数据,这些研究人员努力处理海量的数据。新一代测序技术的最新进展使得数十亿个DNA序列可以轻松同时读取。有了这种能力,研究人员可以使用 DNA 序列的条形码作为分子识别“标签”,以跟踪实验结果。另外DNA条形码正被用于大大加快化学工程、材料科学和纳米技术等领域的研究步伐。例如,在佐治亚理工学院,James E. Dahlman的实验室正在迅速确定更安全的基因疗法;其他人正在研究如何对抗耐药性和防止癌症转移。

不过目前阻碍DNA数据存储方式普及的原因之一便是读取和写入DNA的成本太高、速度还不够快,要与电子存储竞争,就必须进一步降低这些成本和提高速度。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分