一克DNA存下全球信息,资本正在赶来!
比尔盖茨有张极具意义并奉为经典的照片。1994年38岁的比尔盖茨坐在33万张纸上,手中拿着一张光盘告诉全世界:一张光盘能记录的内容,比这里33万张纸上的信息都多,自此开启光盘存储新时代。
“未来5-15年,中国科学家将在数据中心,手中拿着一管DNA告诉全世界,这里面记录的是当前全世界的数据”!去年9月“海上院士讲坛”上中国科学院院士樊春海对未来DNA存储技术的前景作出预判。
仅仅过了几个月,中国科学家就在DNA存储技术上实现了重大突破!日前,东南大学师生团队成功将校训“止于至善”存入一段DNA序列,实现了DNA存储技术的新突破,并将相关成果发表在国际学术期刊《科学·进展》上。
该研究团队带头人刘宏教授对外表示:“我们的重要突破点就是实现了DNA合成与测序环节的一体化,实现一体化后,DNA存储的效率和准确性会提高,更容易实现大规模的数据存储”。
01
一克DNA存下全球信息
什么是DNA存储?人们为何急于寻找新的数据存储技术?
众所周知,目前计算机存储的数据都是依据电压的高和低代表0和1来表示的,DNA存储则是把原本这些用0和1来表示的内容换成用碱基:A,C,G,T来表示,简而言之就是用遗传代码替代计算机代码,实现从数字信号到化学信号的过程,被称为数据存储终极技术!
“DNA是一种序列确定的生物大分子。DNA存储技术就是将生物DNA分子进行编码,从而在DNA序列上存储信息。”东南大学生物电子学国家重点实验室刘宏教授介绍。
DNA携带有合成RNA和蛋白质所必需的遗传信息,是生物体发育和正常运作必不可少的生物大分子。存储模式DNA这种双螺旋结构上有4个化学基团,即核碱基,每种碱基都有一个字母标识:腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)。它们按照特定顺序排列,组成遗传信息,指导生物体生长发育。
研究人员开发的DNA数字存储系统利用这4个碱基“字母”,开发定制代码,核碱基可以看做是编程代码0,1,组成完全区别于生物体所用“语言”。当复制一份计算机文件时,DNA数字存储系统首先把硬盘信息中的二进制数翻译成定制代码,然后借助标准DNA合成机器制造出相应的碱基序列。所以,DNA存储技术就是用人工合成的脱氧核糖核酸(DNA)存储文本文档、图片和声音文件等数据,随后完整读取的技术。
那么研究DNA存储,用遗传代码替代计算机代码对于我们而言有何意义?
随着使用网络的人们越来越多,网络中上传和使用的短视频、图片、邮件等数据也呈几何倍增加。分析公司 Domo 公布的数据显示,2021年全球人均每秒将创造约 1.7 兆字节的数据,假设世界人口为 78 亿,一年可创建约 418 ZB(4180亿个1TB硬盘的信息价值)。此外,随着物联网、5G等技术的不断落地,网络数据超载所造成的存储问题将越来越凸显。
那么将DNA作为存储介质究竟有哪些优势?刘宏教授表示:“一是信息密度高,据微软研究院此前估计,1立方毫米的DNA就能够存储1个EB(Exabyte,百亿亿字节)的数据;二是存储时间长、稳定性强,在合适的条件下,可以存储上万年;三是存储能耗很低”。
由于存储结构与传统磁盘和光盘不同,因此DNA的存储密度极高,1克的DNA就能够存下天量的信息,不再需要成千上万个阿里巴巴、腾讯、亚马逊这样的数据中心对信息进行存储。因此“十四五”规划纲要进一步将DNA存储提升至重要的地位。
“十四五”规划纲要提出,加快布局量子计算、量子通信、神经芯片、DNA存储等前沿技术,加强信息科学与生命科学、材料等基础学科的交叉创新。对此中国科学院院士樊春海认为:“DNA存储与量子计算、量子通信同时写入国家顶层设计,将对后续深入的技术研究、加快技术转化带来积极影响”。
02
各国巨头提前布局
在全球数据信息总量呈指数级增长的背景下,DNA 存储技术也已引起多个国家和地区的重视。目前美国是进行相关规划布局最多的国家,涵盖了从数据“写入”到“读取”的多个技术过程。
早在2017年美国国防高级研究计划局就启动了分析信息学计划,并为哈佛大学、布朗大学、伊利诺伊大学和华盛顿大学提供了约1,500万美金的资助,用于研究和利用各种分子的结构特征和特性来编码和处理数据。第二年,美国国家科学基金会(NSF)投入1,200万美元资助包括基于DNA的可读取电子存储器、使用嵌合DNA的纳米级芯片存储系统、基于纳米孔读取的高度可扩展随机访问DNA数据存储、核酸内存在内的8个研究项目。
2019年以来,美国对DNA存储技术领域继续抓紧布局,美国国防高级研究计划局(DARPA)在推动科学技术基础研究战略中明确提出重点关注基于分子信息学的新计算方法并表示将在更广泛领域探索除DNA分子外更多的数据编码处理新方法。
除了政府和高校外,企业巨头也早早加入DNA存储研究当中。2016年微软与华盛顿大学合作提出了基于DNA存储系统体系架构——键值存储,同时进一步形成了新的编码方案。两年后,微软与华盛顿大学合作创建了一个大型现代数据库,在分子链上存储了破纪录的200MB数据,实现了令人惊叹的存储量。在此基础上,2019年微软与华盛顿大学的研究出能够在DNA中存储1,000MB数据,不仅存储量翻了几倍而且实现了从存储到提取信息的重大突破。
此外,瑞士、德国、日本、澳大利亚等科技发达国家也对相关研发进行了资助,并提升了对合成生物学领域的重视程度。
作为数据大国,我国更是对DNA存储技术领域研发工作给与高度重视。2018年国家重点研发计划中,合成生物重点专项共有36个,总经费将近7.98亿元,并专门设立了与DNA存储技术相关项目。此外还由南方科技大学牵头,上海交通大学、中国科学院长春应用化学研究所、福州大学、同济大学联合申报了“使用合成DNA进行数据存储的技术研发”项目。
本次实现DNA存储技术突破的研究团队来自于东南大学生物电子学国家重点实验室。谈及研究初衷,团队负责人刘宏教授表示:“东南大学生物电子学国家重点实验室,一直从事生物电子方面的研究,近年来该领域迎来一个新的研究方向——DNA存储,于是我们在一年前开始了这项研究。更重要的是,这项研究有助于解决大数据时代数据存储难题”。
出生于1983年的刘宏是东南大学青年首席教授,并入选了国家“万人计划”中青年科技创新领军人才、国家“青年千人”,研究方向是电化学、微流控芯片、传感器以及现场快速检测(POCT)。基于自身电化学背景,刘宏团队在DNA存储研究中改进传统的化学合成方法,运用电化学方法,将东南大学校训“止于至善”4个字“翻译”为DNA序列,并将其存储在电极上,随后又成功读取出来。
此外,特别值得一提的是,国内也有巨头企业提前布局DNA存储技术,那就是华为。2019年,华为宣布成立战略研究院,表示主要研发前沿技术,比如光计算、DNA存储及原子制造。在华为全球分析师大会上,华为董事、战略研究院院长徐文伟表示:“将要借助DNA存储来突破超大存储空间模型和编码技术,打破容量墙”。
03
资本着手开始布局
虽然DNA存储技术目前尚处于实验室阶段,存在合成成本高、合成速度慢、数据读取无法实时等缺陷,并且想要解决这些问题需要突破大量技术环节,但资本市场却开始看好这一未来技术,并且已经机构已经开始在这个赛道着手布局。
奇绩创坛创始人兼首席执行官陆奇对于数字化未来发表个人观点,他强调道:“当前的数字化方式并非一成不变,比如信息表达,可以用非符号的方式。现在的人工智能都是以深度学习为主,而深度学习某种意义上就是一种非符号的表达,它是用重叠向量来表达信息的。而信息也不一定要存储在磁盘或硬盘上。今天在科学界不停探究的是用合成DNA基因来存储信息,信息的密度会大规模地提高。同理,处理信息也不一定要在硅晶片上,可以用其他运算基础,比方说量子计算,就是一个完全不同的、效益高得多的信息处理方式”。
去年,奇绩创坛作为天使投资人投资了一家DNA数据存储技术开发商——密码子。该公司以DNA存储设备为核心,深度融合行业级软硬件、搭建冷热数据分层存储架构,逐步建立DNA数据存储的行业标准,进一步从档案数据、政府数据、医疗数据、自动驾驶数据等市场切入,扩展至各个数字化相关的行业。今年1月,该公司完成了数千万Pre-A轮融资,投资方位凯泰资本、磐霖资本、王道资本以及中关村创业大街资本。
此外,去年5月峰瑞资本和嘉程资本投资了三代DNA合成技术研发商——芯宿科技。3个月后DNA 数据存储技术开发企业中科碳元完成了由英诺天使基金领投,中科天使、常见投资、沸腾创投跟投的数千万元天使轮融资。
基因组学解决方案提供商联川生物也在去年完成1亿元C轮融资用以探索基因合成在DNA存储、工程菌改造、抗体新药开发等多个领域的应用。投资方为华睿投资、海邦投资、锦聚投资以及海越投资。三轮累计融资2.786亿元。
对于DNA存储的投资机会,密码子创始人张璐帅博士告诉记者:“从商业角度看,当下主流存储器,比如硬盘、固态硬盘、光盘等材料占了很大一部分成本。DNA本身作为生物分子可以轻易获取,只是目前大部分DNA存储技术依赖于昂贵的工艺,成本很高。密码子的技术突破对昂贵工艺的依赖。此外,从大数据可持续发展角度看,DNA存储可以缓解数据中心对用电的高需求,以及废弃电子器件对环境造成的巨大负担”。
“对于想进入DNA存储领域进行创业或者投资的人而言,我个人十分看好冷热数据分层存储这个方向。DNA存储目前以冷数据为主逐渐向温数据过渡,最终以冷热数据分层存储一体架构满足大数据存储和计算的需求”,张璐帅博士补充道。
去年“海上院士讲坛”上,元禾原点创投公司合伙人胡晓方博士对于DNA存储的投资机遇和市场潜力表示:“信息技术和生物技术两大支柱产业,他们之间的交融蕴藏着巨大的投资机会。随着大数据时代的到来,DNA存储绝对拥有巨大的市场需求,一个万亿级的市场需求”。
胡晓方坦言:“DNA存储同样存在着巨大的投资机会,微软、华为已经率先涉足。在国外,这个领域每一个微小的技术进步和突破都会获得风险投资机构的投资。在国内,今年已经有很多风投在关注这一领域。从技术发展和产业投资角度而言,中国已经站在世界的前沿,中国的风险投资机构也随之进入全新的时代——愿意投资前沿的底层技术,并进行长时间大规模的孵化的时代”。