搜索 Search
你的位置:首页 > 新闻动态 > 行业新闻

AI加持下 更安全的数据中心已经出现

2018-11-21 11:18:39点击:

最近关于数据中心的一则新闻“火了”。10月1日有网友爆料,位于青岛西海岸的惠普数据中心于国庆节前夕发生大火,现场黑烟滚滚,预估设备受损严重。

在大多数人印象里可能觉得数据中心和火灾没有太大关系,因为机房里除了电子设备,没有别的东西,再加上数据中心都具备有完善的消防监控系统,认为就算有火灾隐患也会很快解决。然而,实际情况恰恰相反,数据中心着火事件并非个例。

图示为青岛西海岸惠普数据中心火灾现场

1

图示为青岛西海岸惠普数据中心火灾现场

2018年4月5号,拥有“信息黄埔”之称的北京邮电大学校园核心机房着火受损,北京众多高校校内网崩溃。

图示为北京邮电大学校园核心机房火灾现场

1

图示为北京邮电大学校园核心机房火灾现场

2015年10月13号,Windows Azure上海数据中心发生故障,机房着火断电,导致Azure基础设施离线无法提供正常服务,受到影响的用户包括金融、互联网、房地产。

同年1月10日亚马逊公司正在美国弗吉尼亚州建设的一座数据中心着火。

2014年7月20日重庆农商行数据中心发生重大火灾,整个机房全部烧毁,直接损失达到一个亿以上。

针对数据中心发生的火灾,业内专家表示险情多发的根源还是在运维管理上,正所谓“三分技术,七分管理”,数据中心的故障大多源自人祸。

图示为百度云计算(阳泉)数据中心机房通道

1

图示为百度云计算(阳泉)数据中心机房通道

IDC超7成故障是人为因素造成的

随着互联网技术在全球的普及,数据中心的规模越来越大,人作为数据中心运维管理上的重要一环,参与了大多数的工作。例如日常巡检、定期检修等,但人为参与程度越高,出错概率也就越大。有分析称,在数据中心产生故障的原因中,人祸占据了七成以上。

例如年初,亚马逊云计算的存储服务爆发了重大故障,大量网站和APP客户受到影响。然而事后亚马逊方面给出的原因竟然是工作人员的低级失误,造成了此次重大故障的发生。无独有偶,3月16日,微软证实其云计算发生了全球性故障,在所有28个数据中心中,有26个出现故障,微软公共云服务中的数据存储故障同时引发了其他相关的服务故障,而原因又是人为因素造成。

图示为借助电子设备巡检数据中心

1

图示为借助电子设备巡检数据中心

AI替代人工 降低的不只是安全隐患

其实,早在数据中心在全球大规模建设之初,如何控制“人祸”就成为数据中心降低安全隐患的重要方向,但是随着单体数据中心规模的不断加大,人力的需求不降反增,而且大量的工作人员,不仅带来人为因素上的安全隐患,还会让工作流程更加复杂,工作效率更加低下。尤其是在当下数据中心不断扩容、新增、改造的条件下,也让很多原来设计的安全规范无法满足实际情况需要。

所以,随着AI技术的发展,数据中心无论是管理、监控还是维护,采用AI替代人工的需求越来越高。毕竟,AI不需要睡觉,可以全天运行,更不会产生放假、生病的问题。那么现在的AI能否真正的替代那些需要人为判断的任务并进行处理呢?

首先可以肯定的是,在数据中心中应用AI有着先天的优势,国内很多新兴或者升级后的数据中心已经开始初步应用AI,例如自动执行IT管理人员设定的任务,将大量原始数据转化为人为可识别的信息。而更深度的AI案例也早已出现,例如百度的云计算(阳泉)中心。

在高度智能化的百度云计算(阳泉)中心,目前已全面实现无纸化操作,通过Pad 、电脑进行巡检。当然,这也仅仅是AI非常初级的应用,现在的百度云计算(阳泉)中心通过建立IDC深度学习模式,已经让数据中心拥有难以置信的效果,比如冷却用电方面,百度云计算(阳泉)中心可以通过分析、学习上百个变量的实际数据,进行冷却方式的智能切换。最直接的表现就是,当外部环境不管是温度、湿度还是负荷产生了变化,AI系统都会智能切换制冷模式,大大提高了数据中心冷却设备的使用效率,并最终大大降低了人力的使用,让PUE这样的关键指标始终维持在1.10这一全国最高水准的水平线上。

那么,现在在AI加持下的百度云计算(阳泉)中心人力使用是什么情况呢?来看一组数据就会非常清晰。百度云计算(阳泉)中心面积约12万平方米,而工作人员仅有60左右,相当于1人可管理2000平方米。想象一下,篮球场大约400平方米,百度云计算(阳泉)中心的每一个工作人员需要同时管理5个篮球场大小的机房!这在当下主流IDC中仅仅依靠人力是不可能实现的,而在AI的帮助下,百度做到了,并且是 24小时不间断的智能防护。

无限憧憬的未来

实际上,现代数据中心越来越庞大和复杂的信息数量及种类,单凭人力已经不足以应对。

相比人工运维中的不足,AI主导的运维管理不仅可以简化流程、提高效率以及综合管理能力,也能大大降低人为产生的故障率。

所以,数据中心采用AI替代人工,降低人在运维管理中重要性的种种举措,正是未来IDC迎接挑战,降低安全隐患的发展趋势。在AI时代下,无人值守的更安全、更高效的数据中心未来可期。