云计算和大数据

AI计算的下一个十年:从硬件竞赛,走向系统级创新的“深水区”

当前,人工智能正以前所未有的深度重构全球竞争形态,算力作为其核心驱动力,已成为大国科技博弈的战略焦点。算力发展的水平与技术路径的选择,将直接影响一个国家在未来智能时代的综合竞争力与主导权。

在此关键阶段,HAIC 2025光合组织大会的召开具有标志性意义。大会系统性展示了开放架构之下国产算力的全链路能力,肩负着推动AI计算从“模型驱动”转向“工程驱动”、从“单点突破”迈向“体系协同”的重要使命。它标志着国产计算正式进入“开放与协同”的新阶段,加速了超节点等关键技术的规模化应用落地,使开放路线愈发成为支撑国产算力实现体系化、高质量发展的重要基石。

传统算力架构遭遇天花板,单点堆叠捉襟见肘

在以往观念里,提升算力通常意味着将系统“做大、做强”。然而,在AI时代,这一传统思路正面临失效。单纯依赖单点硬件堆叠的旧有模式,在面对千亿乃至万亿参数大模型训练所需的巨大算力与极致效率时,已日益捉襟见肘,难以支撑智能计算需求的指数级增长。

IDC中国区副总裁兼首席分析师武连峰在HAIC 2025大会上指出,传统算力架构正遭遇多重深层次瓶颈:其一,算力密度与功耗之墙高筑,仅靠增加高端GPU不仅受到供应链限制,其带来的能耗与散热成本亦令企业难以负担;其二,通信效率成为关键短板,跨节点数据交换延迟大、传统网络带宽不足,致使大规模集群中可观算力资源被通信开销占用或闲置;其三,资源与管理割裂,计算、存储、网络孤立运维,导致大规模GPU集群平均利用率低下;其四,生态碎片化严重,软硬件耦合、标准不一,大幅抬高了开发与迁移成本,阻碍整体创新步伐。

这些结构性瓶颈,直接转化为行业用户面临的现实焦虑与挑战。在性能与效率上,用户担忧模型是否“装得下、跑得稳、用得起”;在生态融合上,跨平台移植耗时费力,人才供给亦不匹配;在稳定与能效上,大模型训练频繁中断、耗电惊人,持续可靠运行成为严峻考验。

显然,传统算力体系已难以承载AI向更大规模、更深层次发展的未来,一场从架构到生态的全面变革,势在必行。

开放计算路线的系统突破

可以看到,当前封闭、垂直的技术体系已不再适应多元复杂的市场需求。行业真正需要的,是通过跨层解耦、分工协作所构建的开放生态。

与许多行业会议不同,HAIC 2025给人最鲜明的印象是“务实”,其目标清晰:直面真实挑战、呈现可行方案。作为AI计算开放领域的首个全国性盛会,光合组织人工智能创新大会(HAIC 2025)始终聚焦于开放架构的推进与实践。大会以“智算无界、光合共生”为核心,致力于推动国产计算走向开放兼容与可持续发展。通过设立AI计算开放架构,积极推动相关标准的制定、测试与认证,目标是打破以往封闭体系的垄断局面,降低创新门槛,让更多企业能够参与到AI生态的建设中,共同打造安全、易用、开放的产品与解决方案。

同时,HAIC 2025也是开放计算成果的一次集中检阅。超过2500家企业在此展示了基于开放理念的各类成果,覆盖从部件、系统、基础设施到软件、数据集的全栈层级。从CPU接口与互连总线,到主板定制、存储优化,再到智算中心设计规范、开发者社区建设与行业数据集开放等。这些实践有力推动了算力互联互通、硬件异构融合、软件兼容创新与标准接口统一,全面展现出开放架构对AI计算产业的驱动能量。大会还着力联动产业链上下游,共建开源开放的AI计算生态。

会上,商汤科技、中科曙光、大晓无限机器人、麒麟软件、华大九天、海光信息等企业达成了多项战略合作。

如果说过去我们更注重造就单机性能卓越的“参天巨杉”,那么今天的方向,已转向培育一整片生生不息的“森林”。在硬件层,它拥有地下紧密连接、互通有无的“根系网络”;在系统与软件层,则通过树冠之间的高效交互,实现养分与信息的协同。这是一个开放、协同、共生的复杂系统,能够自我调节、抵御风险,并支撑起远比单一巨杉更为多样、繁荣的生态图景。

生态破局,开放计算方案步入大规模部署深水区

如果你觉得大会上提出的部分理念有些“缥缈”,那么是时候该展示一下强大的开放生态成果了!

从突破性能极限的超节点,到重塑交互体验的AI终端,本次大会发布了多套光合生态创新产品,实现了从“算力”到“体验”的全覆盖。真正将“普惠智算”的理念落地为覆盖高强度计算与日常智能应用的多元解决方案。

以scaleX万卡超级群为例,它就是在光合组织开放架构理念下所诞生的优秀方案之一。该集群融合了中科曙光在大型计算机系统领域的深厚积淀,是面向万亿参数大模型与科学智能等复杂场景打造的大规模智能算力基础设施。

据中科曙光高级副总裁李斌介绍,为应对人工智能基础设施在性能、效率、可靠性与可扩展性等方面的极致需求,scaleX在超节点架构、高速互连网络、存储优化及系统调度等方面实现了多项突破,其部分技术能力已超越海外同类产品至2027年的规划节点,展现出显著的前瞻性。

scaleX万卡超集群全球首创单机柜级640卡超节点,算力密度提升20倍,PUE低至1.04;搭载自主研发的原生RDMA高速网络,带宽达400Gb/s,延迟低于1微秒,可支持规模扩展至十万卡以上;通过存算传紧耦合设计,实现三级数据协同优化,加速卡资源利用率提升55%;配备超集群数字孪生与智能调度系统,实现故障智能定位与万级节点高效管理。

作为“AI计算开放架构”的重要成果,scaleX支持多品牌加速卡与主流计算生态,已完成超过400个主流大模型的适配优化,可广泛应用于大模型训练、金融风控、能源勘探及科学智能等多类场景。

值得关注的是,开放生态的活力远不止于此。除scaleX万卡超集群外,浪潮及中兴也推出了性能强劲的超节点服务器;紫光计算机、中科可控、联想开天与雷神等厂商则集中展示了全国产AI工作站等终端产品。这些丰富多元的创新成果共同汇聚成光合生态的蓬勃图景,诠释了“开放架构、协同创新”所激发的产业动能。

未来演进,技术专家视角下的开放架构前沿

中国科学院院士周成虎指出,我们正站在AI与空间计算的历史交汇点,一个全新的空间现实时代即将开启。地理科学及诸多前沿领域亟需先进的技术体系作为支撑,通过聚合大数据与人工智能来解决复杂问题并预测未来。面向2030年,我们必须依托自主开放的算力系统,构建能够融合全域知识、具备超人类推演决策能力的科学大模型,以此驱动科学发现与颠覆性技术创造,显著提升国家的整体科技创新能力。

为实现这一愿景,开放计算架构已成为关键路径。光合组织所推动的开放架构,正通过一系列机制展现出显著优势:它倡导“让专业的人做专业事”,降低全产业链研发成本;通过分层解耦为用户提供多元选择,避免技术垄断;在开放协作中引入更多监督视角,提升系统安全可控性;同时,该架构降低了参与门槛,使广大中小企业能够深度融入生态、分享发展红利,并支持轻量化部署以灵活适配多样化应用场景。这些特点共同表明,在市场需求与行业应用双轮驱动的AI产业中,唯有开放协作,才能实现跨领域的深度融合与持续创新。

正如国家先进计算产业创新中心主任历军所强调,市场呼唤开放、高效、安全、稳定的智能计算基础设施,产业亟待形成共享协作、互利共赢的格局。这一共识已在实践中得到广泛呼应,从浪潮、商汤科技、麒麟软件等企业的生态分享,到海光、曙光发布的开放战略与超集群方案,充分展示出了产业协同的清晰路径。AI计算开放架构,正是所有合作伙伴协同创新、共同打磨的成果,也为实现面向未来的科学智能愿景奠定了坚实的生态基石。

综上所述,构建自主、开放、协同的先进计算体系,已不仅是技术路径的选择,更是支撑国家科技创新与产业智能化转型的战略基石。它锚定的是面向下一个十年的算力底座,开辟的是一条打破垄断、融合创新、安全可控的发展新路。这条路,需要整个产业的持续奔赴与共同作答。

(0)

本文由 计算杂谈 作者:云中子 发表,转载请注明来源!

LensNews

热评文章

发表评论