首页> 原创文化 > 原创文化 > 从AI Infra到Agentic Infra!华为云极致重构AI算力底座

从AI Infra到Agentic Infra!华为云极致重构AI算力底座

发布时间:2026-06-06 15:19:26作者来源: 15899665370
6月5日,2026华为云INSPIRE创想者大会Agentic Infra云基础设施技术论坛在上海圆满落幕。此次论坛以“进化,从AI Infra到Agentic Infra”为主题,汇聚顶尖技术专家、行业精英与生态伙伴,共同探讨Agentic时代AI基础设施的架构设计、技术创新与演进方向。
 
会上,华为云重磅解读“Agentic Infra”技术新范式——“Agentic计算机”,以四大突破极致重构AI算力底座,为中国企业Agent创新发展持续注入强劲动能!
 
云计算跨入Token工业时代,基础设施面临范式跃迁
 
华为云基础设施云服务产品线总裁 鲍亮
 
“Agentic AI时代正在引发计算范式的一系列根本性跃迁。”华为云基础设施云服务产品线总裁鲍亮在致辞中表示,云计算已跨入Token工业时代。
 
因此,华为云提出Agentic Infra新范式,核心是构建“高效Token工厂+通智一体化调度+持续学习+安全自治”四大能力,具体通过灵衢智算集群AICS打造极致效能Token工厂、以存代算提供PB级记忆空间打破Agent记忆瓶颈、AgentSphere提供高性能安全部署运行时、以及Volcano实现通智一体化调度,通过持续做强根技术,与AI智能化的技术深度融合,为千行百业提供最优的Agentic基础设施底座!
 
软硬芯深度协同,华为云重磅解读“Agentic计算机”
 
华为公司Fellow、云系统首席专家 余洲
 
“在Agent时代,云基础设施就是‘Agentic计算机’”华为公司Fellow、云系统首席专家余洲指出,“Agentic计算机”与传统云基础设施相比,其核心变化在于服务对象从人转向AI、面向每天万亿级Token的处理进行整体优化等方面。
 
为此,华为云基于软硬芯协同,以“Agentic计算机”为核心概念,构建了高效的Agentic Infra,并实现四大突破。
 
一是灵衢网络实现多资源一体化,把分散在数百个机柜中的CPU、NPU、SSD和内存互联起来,使它们能够像同一台计算机里的设备一样协同工作;
二是超节点规模和带宽持续演进。基于昇腾950,华为云发布1024卡的灵衢智能计算集群(AICS),让算力提升2.6倍;基于灵衢总线和弹性统一内存池,突破了大模型推理的内存墙瓶颈,更灵活地支持万亿参数模型训推;
三是推出记忆存储解决方案AMS。依托NPU直通CMS硬件(上下文记忆存储),为Agent提供PB级超大记忆空间,支持KV Cache分层池化,将缓存命中率提升至95%,成本节省高达63%。
最后是提供高性能极简网络,实现算力资源和网络IO资源的灵活配比,以及多网合一。
基于以上四大核心突破,Agentic计算机能够充分满足更高的推理效率、更长的序列和更快的推理速度的需求。
 
 
华为公司Fellow、华为云服务首席架构师 顾炯炯
 
华为公司Fellow、华为云服务首席架构师顾炯炯指出,Agentic AI云基础设施面临小模型单卡吃不满、大模型推理PD分离资源偏科、潮汐效应等因素导致的算力资源利用率低、万卡训练集群故障爆炸半径大等核心困境,传统软硬耦合架构已无法应对。
 
华为云为此推出FlexNPU柔性液态算力创新架构,在业界主流训练和推理框架与昇腾NPU硬件算力层之间引入一层“软件定义调度与虚拟化”软件,实现了多模型及PD推理共卡的算子级的细粒度时空复用,硬件故障隔离以及基于透明快照的极速Serverless弹性,FlexNPU由此带来三重突破:更高效,更敏捷,零宕机,能够大幅降低大模型推理单位Token小模型算力性价比,同时将节点级弹性及硬件故障恢复时间从分钟级降至秒级,从而让用户的每一分算力投入物尽其用,让每一笔Token的支出,不再为空闲算力买单。
 
面向Agent时代,通智融合增强智能基础设施
 
云原生计算基金会(CNCF)中国区总监 陈泽辉
 
云原生计算基金会(CNCF)中国区总监陈泽辉现场分享了一个趋势:CNCF技术栈从云原生平台底座,到今天作为Agentic时代的引擎发展迅速。Kubernetes已经成为标准的AI操作系统,82%的受访企业在生产环境中使用K8s。目前企业优先部署Agentic AI的比例高达74%。从云原生到AI Native,再到现在的Agentic Infra,以Volcano为代表的调度编排成为决胜关键——Agentic不再是工具,而是真正的资源概念。
 
 
CNCF TOC副主席、华为云云原生开源负责人 王泽锋
 
CNCF TOC副主席、华为云云原生开源负责人王泽锋表示,Volcano从设计之初就针对训练和推理的工作负载做深层次优化,现在演进到全新的多调度器免锁并行架构:面向Agentic工作负载,采用极简的沙箱调度策略,调度耗时相比原来下降99%;而传统训推工作负载保持采用批量调度策略,在与Agentic调度一致无冲突情况下,仍可获得最优调度结果。
 
在运行时层面,AgentCube+Kuasar的组合实现了端到端冷启动控制在50毫秒以内的突破。此外,Kthena引入更多智能化算法做路由感知,相关能力将在630版本发布,并在Kthena1.0版本达到正式可商用级别。
 
先进架构还需在真实业务场景千锤百炼。论坛现场,行业领军代表分享了与华为云合作的实战成果。比如AReal不仅在华为云上完成适配,华为云还帮助其在NPU上适配算子和参数传输模块;同样作为多模态强化学习后训练框架,小红书Relax基于全模态统一、生产级框架等三大支柱设计,并通过华为云帮助固量恢复与弹性扩缩;面壁智能将三值量化技术搬到华为昇腾卡上完成训练和推理验证;芒果TV推出芒果灵创AIGC创作平台,其中视频模型已进行昇腾适配。
 
面对Agentic时代万亿Token级的复杂任务,传统“堆卡”模式已成过去,取而代之的是一台以Token为粒度、以AI操作为对象、通智融合的“超级计算机”。
 
未来,华为云将致力于把“Agentic Infra”打造为中国AI产业的自主引擎,让智能体真正跑在坚实、高效的国产底座之上,共同开启智能时代的无限可能。

原创文化更多>>

荣威玩出新花样!行业首创星链大灯,AI 原生第一车家越07来啦 5月销量前二的小型SUV大比拼,比亚迪元UP对比零跑A10 丰田威兰达解析:降至14.08万起,月销量8056辆!还值得选择吗? 一汽-大众迈腾PHEV、探岳L PHEV预售,17.49万起,百公里能耗3L级 比亚迪大汉谍照曝光 纯电版续航将超1000km 赓续不辍力臻完美:劳斯莱斯焕新呈现闪灵系列II 魏牌高山7新品实车现身,长超5米1+熏黑猎装套件,配458马力5月,魏牌热销8119辆,同比增长31.78%!而接下来为了实现更进一步,魏牌高山7新品(暂未命名)前来助力。新车在高山7的基础上增加熏黑猎装套件,并针对车身尺寸以及离地间隙进行升级,动力上继续搭载Hi4性能版,此外还将配备“冰彩沙”、激光雷达+Coffee Pilot Ultra……将于6月中旬正式发布。日前,已有网友拍到了魏牌高山7新品的实车图,下面我们就来提前了解一下。 五月大卖六月抢滩,这几款新车准备再掀风浪? 上市24小时订单破2万台,长城猛龙PLUS迎来集中交付热潮 虚拟假人上岗,行业碰撞测试将迎大变局? 探店同品牌不同命的金标大众:与众07单城过千、与众08喊冷 智界V9首批车主交付!晋升高端圈层用户新宠,这款旗舰MPV凭什么? 2549元华为标准版封神!为何同价位几乎无对手? 2026实测vivo 全能旗舰:不堆虚参数,上班族学生党日常用机全吃透 综合路况,实测油耗不到5L,方盒子也省油! 油电续航都给力,还有大空间和舒适配置,试驾别克至境E7 零跑C10/C11/C16盲订权益落地!定价猜一波? 不造跑车改造“方盒子”,小米寻天增程SUV再曝光 2026年前5个月销量跌了19%,车市正在经历“冰火两重天” 15-20万家用新能源SUV,为什么东风日产NX8值得重点看? 买哪款本田150平踏最合适?13380元起ABS+TCS全配齐! 2.3万的本田400F都来了,曾经的“加价神车”都要挥泪腰斩 本田 2027 款雅阁与 Passport 双车升级:轿车科幻转型,SUV 硬派进阶 24980元!本田CBR400R价格跌落谷底,暴降6000卷死国产品牌? 丰田彻底发力!2026三款全新动力登场,燃油车真的要翻盘了? 车市震荡,吉利为何能逆势连涨?这三点太狠了 华为首款阔屏直板旗舰配置曝光,Mate 80系列累计销量突破649万部 奥迪Q7换代曝光:主动卸下旗舰包袱,反而掀了豪华SUV的桌 全新奥迪Q7官图发布,外观、内饰风格大改 全新奥迪Q7|2.9T发动机,可选六座