助力云计算步新 “一云多芯”在挑战中前行

2023-06-08 09:47:00 来源:光明网

近年来,我国从芯片、整机、操作系统、云平台、中间件到应用软件等技术领域的创新链、产业链已初步形成,以X86、ARM、Power等不同架构处理器的为基础的产业生态框架已基本就绪。国内IT产业生态也随着新一代技术应用场景不断拓展,已经形成了多技术路线全栈式支撑能力。

在数据中心建设方面,随着企业“上云用数赋智”的不断加速和深化,新场景下的算力孤岛问题逐渐凸显。如何实现多种芯片技术路线的高效协同,以应用为导向、从系统设计视角出发,满足多芯共存、多云异构条件下的云原生环境构建,保障业务应用的稳定运行、平滑切换和线性增长,成为新一代云数据中心架构体系需要攻克的新的挑战。

助力云计算步新 “一云多芯”在挑战中前行

浪潮信息副总裁 张东

云计算是协同纽带,“一云多芯”是关键

‘“一云多芯”是打破小生态、构建大生态的关键纽带。信息技术产业链发展迅速,相关技术及产品已开始大规模应用于金融、通信、政府等关键行业。但从产业链协同上看,各环节垂直封闭、生态离散,多个小生态并行存在。自有封闭小生态的排他性不利于产业的健康发展,难以形成产业合力,同时又给行业用户在技术选型上带来困扰。如何打破小生态壁垒,避免因技术选型失误带来的业务转型失败是各个行业关心的话题。在我们看来,“一云多芯”无疑是个最佳选择。同时,其在一定程度上激发了IT产业链上下游的创新活力,进而促进整体生态的协同发展。

“一云多芯”可满足用户算力多样化需求,并且可有效规避算力孤岛。随着各行各业业务创新的爆发式增长,不同业务场景对算力需求的差异化也越来越多,更多的算力供给从处理器向各种加速器(包括GPU、DPU、FPGA等)转移。为充分发挥多元异构(不同架构、不同种类)芯片的能力优势,金融、能源等关键行业应基于多种芯片架构来构建云基础设施底座,实现多元算力的统一池化管理、统一调度以及业务的差异化部署等,逐步实现从算力并存到算力统一。

“一云多芯”可有效降低供应链风险。“一云多芯”是IT产业链承上启下的关键环节,具备对下纳管底层各种芯片,屏蔽底层基础设施异构芯片差异,对上提供开放、统一的算力接口。但是,目前在云计算产业中,各服务器芯片的表现参差不一,导致用户体验难以一致,应用效果也大相径庭。用好“一云多芯”,可以最大程度的降低技术路线的选择风险,极大提升业务稳定性以及业务改造的灵活性。

由此可见,无论是从业务角度、技术角度,还是产业链角度,践行“一云多芯“已经成为当下及未来云计算产业发展的关键,是产业链相关厂商的必然选择。

“一云多芯”势在必行,但落地挑战犹存

“一云多芯”在云计算步新中已经成为业内共识。虽然“一云多芯”目标明确,但在产业落地过程中仍存在多方面挑战。

首先是理念的转变。IT基础架构经过长期的发展,从大机、小机时代逐步演进到云计算时代,开放计算深入人心。但直至今日,芯片指令集、操作系统架构上的差异化依然制约着架构的横向协同,比如一个应用需要同时适配多个指令集和操作系统的问题仍然很严重。IT产业需要新的理念、新的路径、新的设计,即以CPU为核心的设计模式转变为以系统为核心的设计,以“以应用为导向,以系统为核心”构建新一代产业生态。“一云多芯”是就是这种理念的具体体现。

其次是缺乏统一的“一云多芯”建设标准、规范。算力标准化是产业的愿景,因此基于”一云多芯”打造的算力平台需要标准化、统一化、服务化。各厂商因技术能力差别导致理解和落地模式均有所不同,比如部分厂商将纳管多个独立的不同芯片架构资源池的这种模式也包装成“一云多芯”,由于无法实现真正的互联互通,对业务的连续性造成很大的风险。

实现一云多芯,场景驱动的软件定义是正道

一云多芯的最终目标是支撑用户业务在不同架构处理器之间的低成本切换或者自由切换。因此,基于以系统设计为核心的思维,采用以场景驱动的“硬件重构+软件定义”的融合架构,是数据中心体系结构的发展方向。我们认为可以分“有-好-优”三步走来实现一云多芯的中长期目标。

助力云计算步新 “一云多芯”在挑战中前行

“一云多芯”三步走技术路线

第一阶段:混合部署、统一管理、统一视图

第一阶段解决“有”的问题。以云为入口,通过云操作系统实现异构处理器服务器的统一管理,覆盖国内外主流处理器,提供统一操作界面、操作方式及统一监控运维等,解决云资源池只能承载单一厂商或单一架构处理器的服务器而导致的应用无法跨架构部署、协同的问题。

第二阶段:业务牵引、分层解耦、架构升级

第二阶段解决“好”的问题。在第一阶段的基础上,进一步实现应用的低成本跨架构切换。通过资源层、平台层和应用层的“分层解耦”设计,实现架构升级。

在资源层面,通过跨平台的迁移实现应用跨架构快速部署。

在平台层面,实现平台应用的跨架构混合部署,如数据库集群在一云多芯平台上实现跨架构的状态同步、数据同步,实现了多实例在不同处理器架构的服务器上的并行运行。

在应用层面,可通过服务网格等技术实现应用的跨架构流量切分。

第三阶段:算力标准、全栈多芯、生态共建

这个阶段是解决“优”的问题。从业务连续性的维度,我们认为”一云多芯”的终极目标是实现应用与芯片架构的彻底解耦。这需要硬件、云以及应用等产业链上下游的共同协同,完善异构架构下有效算力的量化方法,以支持应用在不同架构处理器间的等价切换。共同推动应用与云基础设施的一云多芯相结合,打造垂直一体化方案,实现应用层面的跨架构无感知切换。在标准和测评方面,联合专业软件测评机构及产业链上下游生态,形成一云多芯行业标准。

写在最后:

“一云多芯”已经不再是一个简单的口号,而是构建我国IT产业新生态的关键路径。浪潮信息参编的基础设施云管理软件、虚拟化云平台和容器平台等多个国家级、行业级标准,也是以分层解耦、生态共建的理念推进我国信息产业健康有序发展。同样,中国人民银行印发的金融科技发展规划中,也对金融行业“一云多芯”的发展以及相关金融云平台应用标准提出了明确的目标及要求。浪潮信息配合某国有大型银行进行了“一云多芯”的实践,采用多种芯片服务器和云海OS,完成了核心MPP数仓产品的认证测试并实现大规模生产系统应用。同时,针对大数据、消息中心、缓存系统等核心业务平台也全面开展了合作。浪潮信息参与建设的多个行业云平台,在支持一云多芯的基础上,远程跨域管理、集群规模及线性扩展能力同样达到业界领先水平,单资源池规模超过1000节点并可按控制器实现线性扩展,支撑了金融、能源、交通等行业云数智多样化业务需求。

由此可见,遵从“以应用为导向、以系统为核心”的设计理念,秉承“分层解耦、开放标准”的“一云多芯”建设原则,在云计算步新的发展中显得愈发重要,这必将加速IT产业生态的繁荣。(浪潮信息副总裁 张东)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。