2017-12-21 15:11:38
来 源
中存储
磁带存储
CERN存储在磁带上的数据指数级增长,6月底的时候创纪录的完成了200PB数据在磁带上的归档。

欧洲核子研究中心CERN简介

欧洲核子研究中心CERN(European Organization for Nuclear Research)是一个非常著名的科研组织,它位于日内瓦机场不远处的瑞士与法国边境上,矗立着一个棕色大圆球,这里就是欧洲核子研究中心。对普通人来说,这里既神秘又神奇。说它神秘,是因为这里从事的研究,大到浩翰宇宙,小至微观粒子;远可追溯到100多亿年前的宇宙大爆炸,近到我们今天物质世界的构成。说它神奇,是因为它汇萃了全球粒子物理领域的顶尖级人才。地下100深处的大型强子对撞机,更是人类想像力与创造力的完美集合。   

欧洲核子研究中心

欧洲核子研究中心CERN(木质建筑)

科学实验产生海量数据

欧洲核子研究中心(CERN)最近一次震惊物理界的成果当属利用大型强子对撞机(LHC)发现了希格斯玻色子——“上帝粒子”,一种亚原子粒子,其作用是解释为何其它粒子会拥有质量。“上帝粒子”是人类认识宇宙的一面最直接的镜子:理论上认为它应当是构成宇宙的最基本组成部件之一,因为如果作为质量之源的它确实存在,物理学家就可能因此推测出宇宙大爆炸时的情景以及占宇宙质量96%的暗物质(包括暗能量)的情况。 

一直以来CERN都坚持技术创新,我们今天所熟知的3W网、计算机网格技术、手机触屏等新技术,最早都是诞生在核子研究中心。     

  • 核子中心当时所建的网站“Info.cern.ch”因此成为世界上第一个网站和Web服务器的地址。
  • 今天广泛使用的手机触摸屏,也是核子中心的发明。当初,这一技术只是用于加速器的控制系统。后来鼠标发明之后,这项技术就被丢弃了。所以,触摸屏的发明是在鼠标之前。近几年,手机开发商又重新发现并利用这一技术,成为现在所用的手机触摸屏。   
  • 正在研发中的新技术,如果成功将大大造福于人类,这就是使用高能量的质子及其他重离子束治疗癌症。

众多技术成果的产生都离不开实验,因而也就会产生大量实验数据。仅在2017年10月CERN产生的数据就有12.3PB,1个PB容量大概相当于15000个64GB智能手机的存储容量综合,这些数据大部分来自大型强子对撞机的实验,还有一部分是来自其它类型实验以及备份产生。

大型强子对撞机(LHC)是世界上最大最强大的粒子加速器

大型强子对撞机

在大型强子对撞机(LHC)探测器中,粒子以每秒大约10亿次的速度相撞,每秒产生约1 PB的碰撞数据。然而,对于当前的计算机系统来说,这样的数据量是不可能记录的,因此通过实验过滤,只保留最“有趣的”的数据。然后将过滤的LHC数据汇总到CERN数据中心中,在那里执行初始数据重建,并将副本存档到长期磁带存储。即使在实验进行大幅度的数据压缩之后,CERN数据中心平均每天处理1 PB的数据。

“近10年来,CERN存储在磁带上的数据指数级增长,6月底的时候创纪录的完成了200PB数据在磁带上的归档”,CERN IT部门负责磁带管理以及存档和备份存储的负责人German Cancio解释说。

自建磁带管理系统保存200PB数据

CERN数据中心是该组织的核心基础设施,这里收集了CERN每个实验的数据,所有实验数据的副本被存档到磁带上进行长期存储。

CERN的数据中心

CERN的数据中心

CERN收集的大部分数据将被永久保存,这些物理数据非常有价值,永远不会被删除,需要为未来的物理学家保留。

“CERN的一个重要机制就是数据必须长期归档保存”,Cancio补充说到,“哪怕一个实验已经结束,但是产生的实验数据都要保存至少20年,通常还会更久,许多以前的实验数据已经保存超过30年了,数据不断积累增长,我们面临的挑战也越来越大了”。

“磁带”听起来好像已经是一种有点过时的存储模式了,但实际上磁带是大规模海量数据归档存储最可靠、最划算的选择,一直以来在归档领域应用广泛,公认的是数据放在磁带上要比放在磁盘上可靠性更高。

目前中心使用的CASTOR(CERN Advanced STORage manager)是CERN自己研制的存储管理系统,具备分层存储能力,既支持磁带也支持磁盘。

CERN的磁带库系统

图中红圈内为磁带库系统的机械臂,在银色的轨道上滑动,存取两侧堆叠的磁带

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。