top
福建省超级计算中心

李晔:数据中心建设,为何成新基建重头戏

李晔:数据中心建设,为何成新基建重头戏

新基建七大领域中,数据中心具有特殊地位。

3月份以来,中央多次强调“加快5G网络、数据中心等新型基础设施建设”。随后,BAT等纷纷大手笔投入数据中心建设,以腾讯为例,6月份宣布投资450亿元打造长三角人工智能超算中心,这是疫情以来全国单体投资最大的新基建项目,建成后将立刻跻身全国前三的地位。

山东具有良好的数据中心建设基础,早在2011年就建成了国家超级计算济南中心;浪潮也已成为全球前三的超算供应商,在大数据中心建设方面也取得积极成效。

但面对各地、各企业巨头纷纷发力数据中心建设的新形势,山东应如何积极应对、并继续保持领先地位?

起步早,基础好

数据、算法和算力是智能时代的核心技术,其中,数据是“生产资料”,算法是“灵魂”,而算力是“第一推动力”。

国家超级计算济南中心成立于2011年,目前是科技部部署建设的七个国家超算中心之一,也是首台全部采用国产CPU构建的千万亿次计算机。

2011年10月,经国家权威机构测试,济南中心实现了国家大型关键信息基础设施核心技术的“自主可控”目标,标志着我国成为美、日后第三个能够采用自主处理器构建千万亿次超级计算机系统的国家。2018年8月,神威“E级”原型系统又在济南中心落地,首次实现了从处理器、网络芯片组、存储和管理系统等核心器件的完全国产化,整体研制指标国际领先。2019年5月,为进一步推进超算产业化应用,济南中心与济南市共建超算科技园开园,这是全球首个以超算为主题的科技园,也是超算深度赋能其他产业的重要载体。

另外,浪潮集团依托其在服务器领域的优势,在超算领域也已取得不菲业绩,根据第55届全球超级计算机TOP500榜单显示,其已成为全球前三的超算供应商。

中国算谷

今年以来,随着新基建热度的持续升温,我省对算力基础设施建设进行了系统部署,提出要构建高效协同的数据处理体系。其中,基于国家超算济南中心、浪潮集团等在超算领域的优势地位,谋划打造“中国算谷”。这在今年的省政府工作报告中被重点提出,并在之后的《关于山东省数字基础设施建设的指导意见》《关于加快省会经济圈一体化发展的指导意见》以及济南市政府工作报告中又多次被提及。

数据中心建设方面,山东提出要推动数据中心规模化、绿色化发展,支持济南、青岛、枣庄等市做大做强全国性社会化大数据中心,并推进云计算中心、边缘计算资源池节点以及高性能计算中心等多元计算协同发展。

综合来看,山东在算力基础设施和数据中心建设方面具有一定优势,但也需要根据最新发展趋势,进一步加强顶层设计,细化建设内容,以保证在该领域持续走在全国前列。

要处理好国家超算中心与其它算力设施之间的关系。

不同的应用对算力有不同的需求,超算中心是算力基础设施的代表之一,在我省具有一定建设基础及发展优势,主要应用于科学计算领域,采用几万个甚至百万个以上的处理器,并行协同解决一个大问题。但在很多需要同时响应大量任务请求的领域,则需要以云计算中心、大数据中心等为代表的算力基础设施。

另外,随着大数据和人工智能技术的发展,智能应用对算力基础设施的需求不断提升,而传统的算力基础设施并不能有效支持这一需求。当前,美国、日本等国纷纷将正在研制的超级计算机称为智能计算机。基于此,我国也将智能计算中心列为新基建的重点支持领域,以满足即将到来的智慧时代对智能算力的爆发式需求。而我省在超算领域已形成持续资源布局的前提下,如何处理好国家超算中心和其他算力基础设施之间的关系,就显得尤为重要。

要处理好技术驱动与市场牵引之间的关系。

在我国算力基础设施领域,一般来说,国家级超算中心为技术驱动型,即在追赶及保持国际领先地位的国家战略主导下,先研发制造,后寻找应用,这与我国的后发追赶策略有关。这一模式虽然能够实现自主可控等战略目标,但实际利用效率不高的现实也一直饱受各界诟病。

同时,作为大型IT设备,超级计算机受限于芯片等IT技术的飞速发展及其本身能效比的限制,高效率服役的生命周期较短,平均有效寿命只有5年,资产缩水较快,如果在这期间找不到合适且规模化的应用领域,则会进一步造成巨量资源浪费。

要处理好算力突破与生态打造之间的关系。

未来,无所不在的智能终端和海量大数据,都需要强大计算能力的支撑。因此,算力的核心指标就是“快”,这尤其体现在传统超算领域。比如,全球超级计算机TOP500排行榜,将浮点运算速度作为评价核心,而被全世界公认为“超级计算机界的下一顶皇冠”的E级超算,其每秒可进行百亿亿次数学运算,成为当前各国争夺的焦点。而腾讯投资450亿元建设的超算中心,也将总算力“超全球最快超级计算机75倍”作为其宣传的一大亮点。

但超级计算并不仅指超级计算机,而是包括硬件、软件、算法、应用、产业生态等的整体,不仅要在运算速度上达到新水平,而且要在应用上形成新局面。而生态环境的打造,需要构建从基础研究、技术突破、产业研发到推广应用的协作共同体,形成相互关联的社会网络。国产化软件仍然是掣肘我国超算应用的主要问题,目前部署超算的企业还需要把大量的预算留给进口软件。比如,国内的石油石化、制造业的CAE/CAD等商业软件,几乎完全依赖进口。因此,我国发展算力基础设施,不能仅仅追求算力的突破,还要重点考虑良好生态的打造。

要处理好政府统筹与社会参与之间的关系。

受投资规模大、商用领域较少以及经济效益不高等因素影响,我国高性能计算发展之初就是政府主导的模式,并且延续至今。其中最具代表性的即是科技部在全国部署的七大超级计算中心。

而在发达国家,则主要由企业参与建设。如汽车行业的通用、克莱斯勒等公司,每家都有10多个超算系统,英国的BP石油公司也有世界上最大的工业用超级计算。我国建设并使用超算的企业,主要为阿里巴巴、腾讯、百度等大型网络服务公司。

目前,受电力、土地、能耗指标等的限制,一线数据中心建设资源日益稀缺,各大互联网巨头均在积极进行储备,因此我国也出现了社会资本参与算力基础设施建设的趋势。

如上海新基建规划的2700亿元总投资中,2100亿元来自于社会资本;而在腾讯宣布超算中心开工的第二天,快手也宣布在内蒙古乌兰察布投资百亿元建设智能云大数据中心。社会资本的参与,一方面有利于缓解政府财政的压力,另一方面借助企业市场化运作优势,也有利于超算生态的打造。对此,我省也要加强统筹规划,积极引导社会力量广泛参与数据中心建设。

适度超前,更注重“用”

下一步,山东数据中心建设应继续着力于提升国家超算中心服务重大战略需求的能力,打造重量级应用,如在核武器、航空航天、高能物理、电磁仿真和气候模拟等领域的应用,使其成为这些战略部门的基础设施,充分发挥其战略意义。

在商用算力基础设施方面,应围绕我省产业发展的重大需求,做好做细算力需求调研,采用适度超前的原则,积极布局建设面向工业互联网和人工智能的算力基础设施,科学规划算力基础设施的选址,丰富算力的种类,协调推进各类算力基础设施的分级分类部署,充分满足不同行业用户和应用场景下对异构计算的不同需求。同时,对现有数据中心进行智能化、绿色化、规模化改造,比如运用人工智能芯片和服务器来强化其算力,使其成为能提供智能计算服务的算力平台。

在自主研发项目中,要更加强调应用导向。应积极学习美国经验,在开始研究之前,通过综合研判,首先把急需解决的问题及挑战清晰地提出来,并设计可考核的应用性指标,对研究活动进行过程评价。要加强第三方评估,对研发及建设项目的技术创新水平及实际应用效益进行客观评价,从而正确判断算力设施的实际应用水平。

应围绕基础研究、技术突破、产业研发到推广应用这一链条,尤其是根据我省重大战略需求,构建“平台+应用+人才”三位一体的新型发展模式,积极培育完善的算力生态。

目前,能培养高性能计算软件人才的大学很少,我省应引导省属高校积极调整学科设置,扩大该领域的招生名额,组织校企联合培养,建立一批规划建设、测试验证、运维管理等方向的专业人才队伍,解决数据中心基础设施建设运营人才结构性紧缺的矛盾。

另外,我省目前部署了一批大科学计划与大科学工程,也提出了“十强产业”高质量发展的战略任务,尤其是对工业互联网在产业提升中的作用寄予厚望,这些领域都对高性能算力提出了更高要求。我省需要加强谋划,积极培育需求,引导更多社会主体使用高性能算力,通过规模化应用尽快收回成本,使巨额资源投入获得较高的回报,从而形成良性循环。

最后,要加强组织协调,建立省市协同推进落实机制,做好数据中心规划建设论证,推动一批关键性重大算力基础设施落地。要统筹利用各类财政专项资金,支持算力基础设施建设布局和应用创新;引导省内大型基建专项资金向算力基础设施倾斜,鼓励并引导社会资本投入;优化财政补贴方向,统筹兼顾用电量、服务器规模、存储规模等能效与规模指标,探索精准化支持举措;加快下游数据应用环节的市场培育,探索将政府担保、供应链金融等模式引入数据中心产业链,实现产业链企业共同发展。

(作者李晔:系山东省科技发展战略研究所所长,山东省科学院情报研究所所长)

foot