乘AI之风,看新华三集团如何决胜智算新赛道?
共 5164字,需浏览 11分钟
·
2024-05-06 11:44
【全球云观察 | 科技热点关注】
曾几何时,面向AI的全行业激情,催生了前所未有的大机会。要不然,作为紫光股份旗下中流砥柱的新华三集团也不会早在2020年就抢先推出了AI in ALL智能战略。
然而,AI技术在创新蓬勃发展的同时,也加速了业界一轮又一轮的新洗牌。大模型的火热爆棚,引发相关基础设施供应商开启各自的智算之路。
从以往+AI,到如今乘AI之风,看看新华三集团如何决胜智算这个关键赛道?
01
「与时俱进」
做发展新质生产力的好帮手
众所周知,科技领域任何一个赛道的出现,都离不开行业供应商在技术创新上的持续贡献。
一路走来,新华三集团历经了一次次AI热潮的洗礼。更直接的说,新华三集团一路踏浪而来,对智算领域的时机把握,表现得不仅专业,而且有前瞻性。
在这之前,AI in ALL战略逐年深化,“数字大脑”不断迭代升级技术,为新华三提出更快更高更强的智算战略目标奠定了基础。
进入AIGC时代,所有业界供应商都面临一次全新的产业升级与转型机会。在这个时候,新华三集团到底怎样做才能达成快速创新,强化核心竞争力,发展新质生产力?
紫光股份董事长、新华三集团总裁兼CEO 于英涛
紫光股份董事长、新华三集团总裁兼首席执行官于英涛表示,当前和以后都要做好三件大事,一是深化加速AI in ALL,全线产品与解决方案全面融入AI能力,实现全栈全场景技术覆盖。二是AI for ALL,利用技术产品赋能百行百业,即基于对行业需求的深入理解,将AI的能力融入端到端的解决方案中,同时以伙伴式服务,助力百行百业智能化升级。三是充分发挥新华三在算力和联接领域的核心优势,让AI更快、更强和更澎湃,并推动国内智算产业生态发展。
从过往的发展来看,新华三集团从来不打无准备之仗,不打无把握之仗。全球云观察分析认为,提出“算力×联接”的智算战略,新华三也是有备而来的。在AIGC时代,新华三集团早已未雨绸缪,基于在算力、存力、运力、安全、云计算、大数据、智能终端等领域的长期技术创新与行业积累,正在构建一个全面AI化的方案矩阵,以及全栈AI的落地能力。然后,不断深入行业场景,黏合业务应用,在更大范围、更宽领域挖掘出更大价值,以此更好地服务百行百业。
当然,一直坚持无界开放生态的新华三集团,面向AIGC时代的新质转型,在大模型整体发展策略上,实行“1+N”模式,也是非常独特的。“1”代表新华三集团旗下私域大模型百业灵犀(LinSeer);“N”代表N个优秀通用大模型和行业模型优选生态大模型。
在算力创新的道路上,新华三创新不止,生生不息。基于“云-网-安-算-存-端”的广泛布局,多年来以人工智能平台、多元计算平台、智能存储平台、智能管理平台等加持智算创新,引领算力向更高效、更强劲、更绿色迈进。
在这里需要特别指出的是,充分发挥“算力×联接”的倍增效应,有助于促进在技术、产品、方案与服务等方面提升一个新台阶。再加上云与计算存储合力出击,与时俱进的新华三集团,正在AI时代高效转型,这非常有利于打好百行百业大模型应用开局的第一仗,更有利于将AIGC行业落地进行到底。
其实,更直白地说,新华三集团的这一切举措,其目的就是要做发展行业智算新质生产力的好帮手。
02
「基因重组」
打造技术整合优势
不过,在众多供应商齐聚智算之路上时,这个新赛道的竞争必然加剧,因而做个好帮手并非想象的那么容易。对于新华三集团这样的综合性ICT厂商而言,如果说基础决定发展,那么基因决定其发展的高度,倘若能实现基因重组,发挥出技术整合优势,必然竞争力也将提升一层。
究其基因而言,新华三集团源自杭州华三,是一家做网络出身的企业。作为一个网络起家的厂商,必须聚焦优势基因,发挥出自身的网络优势。新华三集团的服务器市场份额排名前二,在人工智能服务器领域的排名也是领先,可见在算力领域也具备同样优秀的实力。
事实上,为了更好地发挥出算力×联接的倍增效应,放大战略价值,新华三集团不仅坚持优势基因,而且正在做“基因重组”,技术整合优势逐渐在凸显,智算效率也将得以进一步提升。
从这个角度来分析,“算力×联接”智算战略的“×”乘号,不仅包含了算力叠加联接的能力,而且也是一次新华三在算力、存力、运力等技术基因上的优势重组。为了更好地应对AIGC时代的各种新挑战,重组的关键必然在于对算力方案和联接方案做最佳的调优与配合。
就此,锁定智能算力发展的根本需求,新华三集团在高效多元算力供给、高品质网络联接、海量数据并行处理、主动安全、智能运维和智能能耗治理等方面持续提升技术能力,充分发挥技术创新的基因重组作用。
在更具体的技术整合策略上,针对数字化基础设施的云与计算存储产品线落地,新华三集团以“×AI”的全栈解决方案赋能行业,打造智算新质生产力,积极应对行业用户的业务应用需求变化。
新华三集团高级副总裁、云与计算存储产品线总裁 徐润安
新华三集团高级副总裁、云与计算存储产品线总裁徐润安表示,在数据治理、异构算力调度、算力创新、数据存储和绿色液冷五个方面,持续不断地融入AI,放大AI价值,助推智算战略一步一步在百行百业落地。
因为所有的AI都跟数据相关,首当其冲的便是面向数据层的数据×AI。面向AIGC与智算场景的绿洲大模型数据治理平台,Data For AI的定位必然支撑多模态,通过数据日常清洗、过滤、去重、去隐私、增强及评估的全流程数据处理能力,提供全方位的工具链,为大模型提供高质量的训练以及微调语料数据集。
为了顺应异构多元的算力发展新趋势,调度×AI成为关键。以数据资产为中心,打通大模型各环节端到端业务全流程,构建一站式AI服务平台,为此傲飞算力平台3.0创新升级,全面拥抱“算力即服务”,具备AI业务调优、异构算力统一智能调度、大规模智算中心运维的三大能力。
AI in ALL是新华三集团的整体战略,在算力的产品创新上,新华三集团也一直坚持开放包容、多元异构的设计思路。聚焦算力×AI,采取灵活的架构,更强的拓展能力,拥有业界领先的算力技术与产品阵营。在数据中心、边缘端都早已有了全面的产品与方案布局。比如新华三的G7系列模块化异构算力平台,以多元开放、拥抱OAI、存算分离三大优势全面满足AIGC的澎湃算力需求,让智算的未来更富有想象空间。
随着算力澎湃发展,强调存储性能制胜、服务制胜也是大势所趋。聚焦存储×AI,为了实现更高效的海量数据并行处理,全面升级存储软件,从而打造专为大模型训练而匹配的存储。新华三下一代AI存储Polaris系列,满足checkpoint秒级写入和智算千万级小文件并发需求。在智能化方面得以进一步增强,基于大语言模型提供灵犀助手自动调整资源,简化运维,提升存储管理服务体验。
此外,当1.3的数据中心PUE值成为众所周知的行业硬指标时,唯有液冷方案方可达成。聚焦绿色×AI,新华三集团可谓不负业界厚望,全栈液冷降PUE值。不仅专注冷板式与浸没式的全面液冷,而且不断加强液冷交换机和液冷服务器的全栈液冷方案,多维度演进。
在冷板式液冷领域,通用计算、异构计算冷板机型全覆盖,适配不同场景化算力需求。在浸没式液冷领域,打造极致PUE场景解决方案,帮助用户实现数据中心PUE值小于1.1的高指标。
全球云观察分析认为,新华三在构建“绿色×AI”的能耗治理策略上,可谓用心专注。从基础设施到统一运维,打通液冷全产业链,助推液冷标准化的进程,实现液冷技术全场景覆盖,从而助力百行百业全面实现“ALL in GREEN”。与此同时,积极响应“双碳”战略,以液冷等技术打造绿色产品,通过智能化实现绿色管理与运维,带给用户最佳应用体验,在不断增强产品与方案竞争力的同时,最大限度地满足数字产业的绿色、高效需求。
03
「走向规模化」
如何用好GPU千卡万卡?
然而,话又说回来了,×AI的技术整合策略再好,也需要看效果。效果是检验创新技术与策略成功的唯一标准。什么效果呢?乘AI之风而上,在智算发展道路上,如何助力用户达成GPU千卡万卡的高效互联效果?
在当前这样一个技术爆炸的时代,技术演进从来就没有停止过。随着国内智算中心建设如火如荼在进行,针对大规模、异构GPU的构建需求逐渐凸显,千卡万卡GPU规模化落地成为一个明显的大趋势。
从千卡到万卡,从单一品牌卡到多元异构卡,在这样的需求驱动下,智算中心如何能更高效?虽然业内不少厂商都在推动智算中心战略布局,但是如何更好、更快地落地GPU千卡万卡却存在着一定的挑战。况且落地的事情并非PPT上说的那样简单,不以实现高效AI算力为目标的落地,往往都是喊口号。
挑战越大,机会就越大。早已瞄定异构计算领域的新华三集团,真打实干,在2024年4月16日正式对外宣布将傲飞算力平台升级到3.0。
值得一提的是,傲飞3.0直接切中当前用户的AI算力痛点与要害,支持万卡规模的集群算力调度,让用户不仅快速落地千卡万卡,而且更要用好千卡万卡。
对于用户而言,能落地虽好,但用得好,才是硬道理。在异构算力统一智能调度上,傲飞3.0支持多元CPU和GPU的异构算力统一调度,支持物理和虚拟算力资源的统一分配调度,同时拥有构建一库多芯能力,自研统一集合通信库UCCL ,实现异构GPU统一通信、模型自适应切分,有效提升23%算力。
在此之前,我一直非常关注傲飞算力平台的进化,傲飞算力平台(AMPHA)是新华三集团基于Kubernetes和Slurm自主开发的AI和HPC资源一体化管理的集群管理平台,现在正式升级到3.0,全面拥抱”算力即服务”。不仅聚焦高效多元算力供给,而且采用从GPU到存储的直通架构,实现高效访问存储,为用户算力中心提供大模型智算基础设施。
此外,这次3.0升级之后,其运维能力可谓更上一层楼了。可以更有效支持多样化应用场景,灵活支持云上、云下多租户管理,以及针对集群算力资源实现统一管理、监控、告警与运维。
针对高可靠算力任务保障,3秒内故障检测,5秒内自动隔离,10秒内启动算力替换,分钟内恢复业务。
不仅如此,新华三集团联合国内外多家GPU厂商,创新提升多元异构算力的能力,继续丰富无界开放大生态,挖掘智算生态价值。
站在行业发展的前沿,决胜智算新赛道。新华三集团凭借最新智算战略,在继续深化“AI in ALL”和加速“AI for ALL”战略的基础上,充分发挥“算力×联接”的乘数效应。进一步将新华三领先的算力和联接技术进行最佳的调优与配合,带来倍增的技术整合优势和智算效率。未来持续创新数字基础设施,放大智算资源价值,发挥AIGC应用的最大潜能,全面拥抱“×AI”的无限机遇,迎接AIGC数据大爆发的到来。(by Aming)