编者按:
2022年3月4日上午,广州南方学院(原中山大学南方学院)特聘教授、华韶数据谷联合创始人兼研究院院长、云润大数据IDC项目顾问蓝云,接受了广东电视台经济科教频道、南方财经全媒体集团记者的采访。考虑到“东数西算”、数据中心的专业性,为便于普通电视观众了解,蓝云在采访前准备了一份科普资料。现分享给大家,同时一并欢迎各位专家大咖指导交流。
本文只是采访前科普资料,真正的采访内容,请留意广东电视台、南财集团近期节目。(20220304)

蓝云在办公室接受了记者采访。身后“蓝天白云”牌匾为书法家、原南方报业传媒集团总编辑王春芙老师2010年题写,那一年也是虎年。
自南水北调、西气东送、西电东送之后,东数西算现在也成了热词。这些可都是举足轻重的国家重要战略。近期很多朋友也就此各种方式向我提问,在此我统一作答。
近年来随着互联网,尤其是移动互联网,以及大数据、区块链、人工智能、5G新技术新应用的高速发展,全球数据总量呈现高速井喷状态,最新的总量50—55ZB左右。ZB是数据存储单位,为2的70次方字节。这些海量数据和我们每一个人息息相关,你用手机随手拍一张图片,上传到云端,就产生了数据量;你躺在沙发上刷抖音看头条,手机要从后端的服务器上调用数据,就和数据中心产生了关联,你看到的短视频原来并不存在你的手机上,是从后端调过来的;春节期间微信红包,双“十一”期间网络购物,里面要反复调用后台数据,尤其是几亿用户的高并发,涉及到很大强度的很多数据存储及计算;现在办理银行业务不去柜台了,手机上就能处理,以及滴滴打车、叫外卖等等,这些我们耳熟能详的日常行为,都与数据中心有关。我经常比喻:数据就像人,每个人都需要一个安全、舒适、交通方便的家,那么数据也同样需要一个安全、舒适、交通方便的家,这个“数据之家”就是数据中心。数据中心的全称是互联网数据中心,英文为 Internet Data Centre,简称IDC。
中国是互联网应用大国,很快中国将成为全球最大的数据总量国家。但我们还不是数据中心强国。全球目前大概有5000万台商用、行业、产业使用的服务器,其中接近一半部署在美国。中国大概占全球的30%份额,拥有接近1500万台服务器,年耗电量接近1000亿度。
服务器是存储数据的基本物理单元,大家可以理解为台式电脑主机。服务器需要持续供电,需要一个能散热、不震荡、没灰尘的环境。服务器要放在机柜里面,机柜通用尺寸为宽0.6米、深1.2米、高2.2米,相当于篮球明星易建联的尺寸。一个机柜可存放10台左右的服务器,放多少服务器,就看你放的紧密程度。机柜必须放在空调房,恒温、恒湿、防震。多个机柜集中存放在一起,就成了机房。一个很大型的机房,或者是多个机房集结在一起,就成了数据中心。数据中心必须远离会带来灰尘的火电发电厂,避开地震带、台风、易涝区域,地质稳定,周边还不能有大的噪音源。

一个标准的机柜,相当于篮球明星易建联的尺寸。南方少钿/制图
对于数据中心,有各种衡量指标。一个是按照规模,小型的不超过500个服务器,中型的不超过2000个,大型的不超过1万个,超过1万的是超大型数据中心。
第二个是安全级别指标,国际通用是按T1、T2、T3、T4分成四级。T1最低,年宕机时间不能超过28小时,T4最高,年宕机时间不能超过0.4小时。经营团队建设的华韶数据谷目前属于T3+级别,现与中国联通合作有几千台服务器。为了确保极端情况数据不丢失,需要双备份,特别重要的可能还要三备份甚至更多。根据规划,韶关数据中心集群到2025年的规划目标是建设500万台服务器(投资超500亿元),相当于当前全球十分之一的体量。每台服务器的采购成本有高有低,从几千元到几万元,甚至上百万元,可以以平均1万元计。500万台服务器的直接投资规模,以及因此带来的间接效益、拉动效用有多大,大家可以去测算。这可是韶关自改革开放以来,迎来的最好的发展机遇!
PUE是第三个指标。数据中心不能断电,是耗电大户。业界用PUE(Power Usage Effectiveness)来测算电能利用效率,计算公式为:PUE=Pt/PIT,其中Pt为数据中心全年总耗电量,单位是KWh;PIT为数据中心的IT设备全年耗电量,单位也是KWh。PUE值越高,说明是粗放式经营,有不必要的浪费,当然了,PUE值理论上再低,也会比1大。现在提倡绿色数据中心,此次国家要求的韶关等东部集群PUE不能高于1.25 ,而贵州等西部集群PUE不能高于1.2。大家可以看到,对东部的要求比西部的低。为什么呢?西部平均气温比东部低,空调用电量就省下来好多了。
第四个指标是上架率。就是机柜(也称机架)建好后,里面要有服务器在工作,机柜相当于房子,服务器相当于人,房地产行业有楼没人,那是“鬼楼”。国家为了避免资源浪费,对上架率有要求,此次八大全国一体化节点要求上架率不低于65%,这会避免一些区域一哄而上、过热建设。
第五个指标是时延。数据在光纤中是光速传播的,但既然是传播,总会要耗费时间,而且还要有逻辑运算等。现在韶关数据与大湾区的数据传输有几个毫秒(ms)的延时,未来争取做到更低。1毫秒什么概念,相当于我们常说的“1小时生活圈”。以广州为例,现在的数据中心会建设在南沙、番禺,下一步建设在韶关,让数据在路途上跑的时间从南沙到广州市区,与从韶关到广州市区一样。我们刷抖音视频时都体验到,会卡,那就是时延或网络中断。毫秒级别的时延,普通人没感觉,但金融行业等部门要求高。看到过一篇报道,中国移动国际公司正在积极筹备推出“低时延交易所直通专线” (“Low Latency for Stock Exchange”,简称“低时延”),其中的规划是香港交易所至香港: ≥0.018 ms,深圳证券交易所至香港: >2 ms,上海证券交易所至香港: >27 ms,纳斯达克股票交易所至香港: >225 ms。大家可以细细品位这几个数字,有了感觉,再看好莱坞电影《偷天陷阱》可能更有收获。
小结一下,数据中心有五个指标,规模、安全级别、能耗指标PUE值、上架率、时延。

在线运行服务器数量统计及测算。(来源:CDCC数据中心)

数据中心年用电量统计及测算。(来源:CDCC数据中心)
数据中心是耗电大户,另外一种形式的“电老虎”。全球的2%用电,都耗费在数据中心了。服务器规模、型号不一,华韶数据谷专家团队最早与韶关市委市政府主要领导沟通时,是以1KW每台服务器功率综合测算,以5万个机柜平均上架率70%计算,每年用电量是约30亿度。根据测算,工业用电综合加权后东莞是每度电6毛多,韶关电源充沛,电价可以谈到4毛多,每度电有两毛的差距。30亿度就是6亿元的差距。广东21地市,年平均气温最低的也正是韶关。因此稍微有点经济测算思维,考虑集群时都会把韶关当做候选。当然韶关还有区位、交通、安全、气候、网络、电力等方面的综合优势。还有一组数据,值得留意,大湾区以占全国1%的土地、5%的人口,产生了全国13%GDP,土地、电力都无法承载数据中心未来建设需求,只能向粤东、粤西、粤北走,粤东、粤西靠海有台风,就只剩下一个答案粤北了。不管是算经济账,还是算共同富裕账,大湾区选址韶关作为数据中心集群,中央和省里都是经过深思熟虑的。当然了,同在粤北的清远,有点可惜。其实清远先发优势很好的,腾讯在那边布局了几十万台服务器。
最后,祝贺韶关,期待韶关!对了,各位朋友,快去韶关买房吧!

到2025年,韶关数据中心集群将建成50万架标准机架、500万台服务器规模,投资超500亿元(不含服务器及软件),以承载低时延类业务(时延要求小于20ms)的大型、超大型数据中心为主,辅助建设部分确需在省内建设、承载中时延要求业务(时延要求20-50ms)的大型、超大型数据中心。
学者网

评论 0