如今智能手机的存储空间越来越大,可全球的数据存储很快就会亮出“存储空间不足”的预警。

根据软件公司Domo的报告,2018年人们每分钟在Google进行383万次搜索,在YouTube观看433万段视频,发送159,362,760封电子邮件、473,000条Twitter和49,000张Instagram照片。

而在中国,每天在微信发出的消息就超过450亿条。Domo预计到2020年全球人均每秒将产生1.7 MB的数据,以全球人口78亿计算,那么一年就会产生418 ZB的数据,大约需要4,180亿个1TB硬盘才能装下。
这还没考虑到人口的增长趋势,联合国预计世界人口在2050年就能突破97亿。这意味着现有的数据存储系统撑不到下个世纪了。

(Source:联合国)
数据的爆炸式增长,迫使人类寻找更好的数据存储技术。有人尝试用1公斤DNA存储全球数据,微软则研发出可以号称可以使用上千年的“玻璃光盘”,然而技术最先进的科技公司还在使用磁带存储数据。
人类文明狂奔五千多年,但现在可用的存储介质最长的寿命最多才约60年,数据存储的未来到底在哪里?
2019年了,科技公司为什么还在用磁带存储数据?
在很多人印像中,磁带仿佛是上个世纪的古董了。不少80后90后当年还是以买磁带来支持自己的偶像,任贤齐1996年发行的专辑《心太软》录音带销量就突破了千万。
然而随着CD、MP3、智能手机相继在音乐市场上各领风骚,磁带也成了一代人的回忆,在生活中难觅踪影。可磁带并没有死,反而在大数据时代成了最具竞争力的存储介质。
目前包括Google、亚马逊和微软等科技巨头其实也还在使用磁带来备份海量数据。为什么放着机械硬盘(HDD)和固态硬盘(SSD)不用,反而去用磁带存储数据呢?

最重要的原因还是便宜,这些科技公司的用户数以亿计,需要存储的数据量十分庞大。尽管云计算是未来趋势,但对于提供互联网服务的公司来说,依然需要将数据存储到本地,这将是一笔不菲的成本。
尽管与硬盘和半导体存储器相比,磁带的读取速度要慢得多。但成本却也低得多,1 TB容量的移动硬盘售价约为50美元,相同容量的磁带的价格仅需5美元。

1951年磁带首次用于计算机数据存储。
而且磁带比硬盘要耐用,一般硬盘的寿命不超过10年,每隔几年就要复制到新硬盘中,海量数据复制不止耗时,而且还容易丢失数据,而磁带则可以保存数十年。
此外在使用过程中磁带只需要插在机械磁带库的插槽中,不需要耗电,也节省了不少电力成本,要知道2025年全球数据中心的电费将会超过百亿美元。
对于很多公司来说,数据存储的安全性往往是重要的。因为磁带不安装驱动就无法访问,这种脱机状态隔绝了黑客和网络攻击,不容易丢失和被篡改。
2011年,Google的Gmail因为一次更新中的Bug意外删除了四万多个账户的邮件,虽然Google一直有在多个数据中心用硬盘存储数据副本,但仍有部分数据无法恢复。所幸这些数据同时也有备份到磁盘里,才得以恢复所有数据。 
(Source:pixabay)
因此除了科技公司,不少对于数据安全性有较高要求的企业和机构其实也还在用磁盘存储数据。比如银行、保险公司、国家文件馆,以及科研机构,其中就包括美国国家航空航天局(NASA)。
但磁带并不是因为安全和成本而牺牲效率的数据存储载体,磁带技术的发展已经超出很多人的想象。
Sony在2014年利用自主开发的溅射薄层沉积技术,将7.7纳米的极细磁颗粒铺设在磁带上,实现了高密度磁存储,存储容量可以达到185TB。

IBM容量330TB的磁带。
IBM在瑞士苏黎世有一个专门的研究团队来负责推进磁带技术,据团队科学家Mark A. Lantz介绍,IBM在2017解决了每平方英寸(1平方英寸= 0.00064516平方米)存储201千万亿字节的难题,并通过引进Sony的溅射薄层沉积技术,将单盒磁带的容量提升至330 TB。
更重要的是,磁带的存储容量已经以每年33%的速度增长了多年,而且并没有放缓的迹象。消息存储行业协会(INSIC)预测2025年磁带存储密度能达到每平方英寸91 GB,到2028年将突破每平方英寸200 GB。
而硬盘的磁录密度增长速度却已经降到了10~15%,因为当硬盘的存储密度达到一定极限后,要再缩小磁性颗粒大小,就难以保持磁性稳定,这就是所谓的超顺磁极限(superparamagnetic limit)。
根据IDC的数据,网络上的大数据正以每年30%~40%的速度增长,而目前硬盘容量增长的速度不到大数据增长速度的一半,磁带却可能成为遵循摩尔定律的最后一种信息技术。
众多厂商在尝试突破存储技术的极限,但没那么容易
正如上文所述,企业级的数据存储设备至少要兼顾下面这些因素:成本、安全、耐用和存储密度。那么除了磁带,我们真的没有别的选择吗?
只能说,现阶段磁带是性价比最高的大数据存储介质之一,但很多厂商也一直在研究新的存储技术。比如硬盘厂商希捷科技和西部数据开发出的热辅助磁纪录技术(HAMR)和微波辅助磁纪录技术(MAMR),就有望让硬盘打破超顺磁极限。
这两种技术分别通过激光和微波来降低介质的矫顽力,在超高密度的数据存储中时保证足够的稳定性。但这两种技术都还未完全成熟,需要更多时间才能完全商用。
另外一种可能像磁带一样被忽略的就是光存储技术,CD和DVD都是光存储介质的一种。但过去的CD容易老化,同时由于衍射极限的限制(可以看做光盘里的超顺磁极限),存储密度也十分有限。

(Source:pixabay)
但蓝光光盘改变了这一切,据华录光存储研究院营销中心副总经理胡冰介绍,蓝光光盘同样具有可靠稳定和使用寿命长的特点,使用寿命能达到约50年,单张蓝光光盘的容量已达500 GB,未来有望突破TB级。
图片来自:ssdfans
同时蓝光存储对温度等环境温度要求较低,不需要空调冷却系统,这大大降低了成本。Facebook的数据中心就采用了蓝光存储,与硬盘相比节省了超过一半的成本,耗电量则降低了80%以上。
微软最近曝光的Project Silica项目其实也基于光存储技术,是通过飞秒激光技术(一种以脉冲形式发射的激光,常用于近视矫正手术)在一块玻璃上形成一个纳米尺度光栅层结构,并产生不同深度和角度的变形,有点像刻录光盘,不过密度更高也更复杂,一块2毫米厚的玻璃可以包含一百多个数据层。

目前微软已经和华纳兄弟公司合作,成功将1978年的《超人》电影母带存储在一块75×75×2mm的玻璃中,并通过机器学习对于玻璃中的数据进行了非顺序的读取,只不过读取速度还有待提升。
跟光盘不一样的是,Project Silica的数据是存储在玻璃内部而非表面,因此数据不会因为玻璃磨损而丢失。研究人员将这种“玻璃光盘”放进摄氏500度的烤箱、用微波炉加热、废水煮泡,甚至用钢丝擦洗后,数据依然能顺利读取。

虽然这项技术仍处于初期阶段,但英国微软剑桥研究院的实验室副主任表示,这种“玻璃光盘”可以持续使用上千年。此外玻璃对温度和湿度也没什么要求,这能大幅降低数据存储的成本。
实际上“玻璃光盘”并不是微软的首创,早在2016年英国南安普敦大学成功用类似的技术将数据编码到玻璃中,可以承受摄氏1000度高温,号称在常温下寿命接近无限,即便在摄氏190度下也可使用138亿年,要知地道球的历史也才大约46亿年。

值得一提的是,微软的Project Silica项目正是和南安普敦大学合作开发的,这种玻璃光盘又被称为5维光盘,由纳米结构的三维,再加上整体尺寸和方向构成。同等尺寸的玻璃光盘存储容量是蓝光光盘的3,000倍。
如果成功,真的可能像南安普敦大学研究人员所说的,开创一个数据永久存储的新时代。
最好的数据存储载体,可能就是我们自己
数据存储领域里一个更大胆的设想,是生物质硬盘,就是将信息存储在DNA中。
DNA是如何存储数据的?其实原理不算复杂,所有计算机数据都是以0和1组成的二进制数存储和运算的,而DNA存储技术则是用四种碱基来代替0和1,将数字信号转化为化学信号。
2017年,哈佛大学医学院就利用CRISPR DNA编辑技术,将一张赛马的动图录入大肠杆菌的基因组中,并以超过90%的准确率读取出来。

近几年也出现了不少探索DNA存储技术的创业公司,前段时间创业公司企业Catalog宣布将维基百科英文版一共16G的所有文本存储在一个DNA分子中,通过一台超大型DNA书写器完成,数据写入速度能达到4 MB / s。

里面就是存储了16G维基百科的DNA。
而另一家叫做Twist Bioscience的生物科技公司,是目前全球最大合成基因的供应商之一。据其创始人Emily Leproust介绍,该公司一粒胶囊中的DNA可以存储相当于整个Facebook数据中心的数据。

目前Twist Bioscience已经向客户推出DNA存储的服务,但价格却很感人。存储12 MB数据的价格就高达10万美元,但Emily Leproust表示未来这一价格将降到10美分。
2016年哈佛大学在学术期刊Nature Materials发布了一项关于DNA存储技术的研究成果,指出DNA的存储密度远超目前任何一种存储介质,经过换算,1kg的DNA就能存储全球一年产生的数据。
但DNA存储目前还远不是理想的数据存储技术,除了昂贵的成本,由于DNA存储的数据只能通过测序来读取,读写速度非常缓慢。有人计算过如果要将2017年全球产生的16 ZB数据存储到DNA中,需要花费40亿年。
今年年初微软首次实现了全自动DNA消息存储,让DNA存储技术从实验室迈向商业化更进了一步,但仅仅是编码“hello”五个字母,从转换到读取就要花费21小时,同时读取的准确度也有待提高。
由此可见,虽然DNA存储技术确实有可能彻底解决全球数据存储的问题,但这个未来还有一段不短的距离。
数据永久存储有可能实现吗?
随着各种技术成熟,人类正在追求消息存储在时间和空间两个维度上的极致:超高的存储密度和永恒的存储时间。
没有人知道这能否实现,因为没人能活到永远,人类最早的文本纪录,也只是5,200年前苏美尔人留下的楔形文本,然而网络诞生仅仅50年,50年前的数据有多少至今仍保存完整呢?
在科幻小说《三体》中的未来世界里,即便一粒米大小的量子存储器就可以放下一座大型图书馆的数据,但最多也只能保存2,000年。最后人们发现把消息存储1亿年的唯一可行方法,就是“把字刻在石头上”。