点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:华为云发布FlexNPU 打造弹性伸缩的“算力金箍棒”
首页> 经济频道> 光明经济 > 正文

华为云发布FlexNPU 打造弹性伸缩的“算力金箍棒”

来源:光明网2026-03-21 21:55

  3月20日,华为云中小企业AI解决方案发布会上推出了一项算力黑科技——柔性智算操作系统FlexNPU,将Token消耗“吞金兽”有效控制在企业预算范围内,打造面向Agentic时代的极致Token性价比,为企业级智能体的普及突破算力瓶颈。

  华为云中国区销售伙伴发展部部长、华为云中国区Marketing与解决方案销售部部长郭婷在致辞中表示,2026年华为云将构建AI时代更加肥沃的“黑土地”,让算力服务更柔性、更适配中小企业的轻量化需求,实现从“调度靠拍板”到“成本算到精”的转变,解决“用不起、用不好”算力的核心难题。

华为云发布FlexNPU 打造弹性伸缩的“算力金箍棒”

华为云中国区销售伙伴发展部部长、华为云中国区Marketing与解决方案销售部部长郭婷

  企业AI应用现状:一半是海水,一半是火焰

  当下,“养龙虾”成为全民热点话题,为千行万业尤其是中小企业提供了建设智能化工作流程的清晰思路。会上,华为云SMB解决方案与持续运营部部长刘杰用“一半是海水,一半是火焰”生动形容了目前企业智能化转型的现状:以OpenClaw为代表的先进生产力工具层出不穷,但AI实际应用往往面临着成本高山、技术壁垒、场景错位等挑战。

  对此,华为云发布中小企业AI解决方案,涵盖AI基础设施层、模型服务层、智能体平台层、智能体应用层,帮助企业打造能对接ERP、能调用API、能闭环业务流程的“数字员工”。目前,华为云已深入2600多家企业、30多个行业,解决500多个AI场景化问题,成为企业AI创新路上的可靠伙伴。

  刘杰介绍,在AI基础设施层,华为云提供昇腾多代系产品,以及自研的AI Infra OS,尤其是FlexNPU柔性智算技术,一方面满足中小企业小模型训练场景,另一方面通过弹性调度能够大幅提升资源利用率;在模型服务层,华为云支持业界主流开源模型,让企业既能根据业务需求灵活选择,也能结合自有数据低成本微调专属模型;在智能体平台层,华为云提供易用高效的Agent开发环境,助力开发者和中小企业面向行业结合场景打造企业级智能体;在智能体应用层,华为云联合伙伴深入场景,覆盖洞察分析、营销运营、协同办公、开发运维、内容制作等高频需求。

  刘杰还表示,华为云致力于提供AI解决方案,做好基础设施和平台底座,伙伴则提供AI行业解决方案、AI行业场景应用、AI专业服务交付,实现深度共创。会上,华为云发布“加速智能化 企业快成长行动2026”,为中小企业、开发者提供从品牌、商业、技术等全方位的支持,共赢AI市场,共同加速企业智能升级。

  打造算力“金箍棒”,大幅降低算力成本

  “我们的推理池平均利用率竟然不足30%,我们花费重金建设、动辄数万、数十万卡的AI硬件算力池,竟有超过一半以上的算力在‘摸鱼,吃空饷’。”华为云首席架构师、华为公司Fellow顾炯炯在现场抛出了一组惊人数据。他指出,Agent时代企业普遍面临算力痛点:Agent自主规划、多轮迭代、长上下文导致Token消耗量呈指数级增长,如何有效降低Token成本,成为最核心和迫切的挑战。

  为此,华为云发布了黑科技——柔性智算FlexNPU,通过构筑强大而灵活的AI Infra层算力调度技术,大幅提升推理池的有效算力利用率,从而以相同AI硬件算力投入,提供更大的Token吞吐输出。

  对于柔性智算FlexNPU,顾炯炯以可大可小、变化随心的“如意金箍棒”生动形容,表示FlexNPU赋予NPU/GPU算力“柔性或液态化”供给与伸缩的能力,可依据任意业务需求动态变化随需而动,如同金箍棒一般“可大可小、变化随心”,通过最大化AI算力投入的利用率,最终实现Token性价比的最优化。

  具体而言,柔性智算FlexNPU具备极致共享、极致弹性和极致高可用3大属性:

  大模型推理方面,FlexNPU通过引入基于柔性算力的PD动态混部、在离线推理混部等创新技术,完美解决了传统PD分离架构下Prefill和Decode集群不均衡的AI Core与显存利用率,以及推理业务潮汐变化规律所导致的大量AI算力空转浪费难题,将带来至少40%的Token性价比提升空间

  小模型推理方面,FlexNPU通过实现最小粒度达1% NPU卡及128MB显存的颗粒度的AI Core时分复用,以及显存空分复用,为小模型提供真正完美匹配其算力诉求、量体裁衣的虚拟NPU资源,将小模型的算力成本降低2-3倍以上;

  推理高可用保障方面,FlexNPU通过软硬解耦及Token级KV Cache的实时快照,使得上层推理框架不再需要感知底层的硬件故障,即可实现故障秒级快速恢复及断点续推,大大减少了Agent推理会话重计算开销,提升了用户的推理体验

  顾炯炯强最后总结到,FlexNPU的核心价值体现在:无需再为大模型推理的闲置算力,以及小模型推理的独占算力浪费买单,更不再需要为昂贵的故障重算买单,真正实现了AI算力分配供给从“资源模式”到“效率模式”的范式转变,“让每分AI算力投入迸发最大价值,让智能体的海量Token人人消费得起。”

  深入千行万业,做好伙伴AI创新的“黑土地”

  华为云领先的智能化基础设施,正在成为千行万业伙伴进行技术创新、产品研发和商业拓展的重要支撑。发布会现场,华为云伙伴代表分享了多个真实案例。

  天宽科技有限公司CTO龚徐建介绍,天宽科技基于昇腾算力平台打造制造业Agent解决方案,可实现智能知识问答、合同智能审核、风险识别等功能,合同审核准确率达90%,审核效率提升3倍,生产数据查询时间从1小时缩短到2分钟,将企业人力从繁琐重复的工作中解放,双方后续将在市场洞察、能力共建、成单路径等方面进行拓展合作。

  天津宏达瑞信科技有限公司CEO丁照祥则从零售物流行业角度,探讨AI落地带来的巨大价值,表示宏达瑞信基于华为云天筹求解能力,打造AI智能路径规划方案,助力商家获得商品从仓库到经销商的运输最优解,并且可以根据复杂的交通条件灵活配置,排线效率提升60倍以上,减少冗余出车次数20%,物流成本降低5.8%。

  人工智能底层技术发展,牵引Al Infra算力基础设施、开闭源大小模型、Agent使能框架与工具等快速演进,激发更多AI创新。面向未来,华为云将秉持“用AI解行业难题”的理念,在应用层、模型层、算力层耕耘AI算力黑土地,携手伙伴共进共赢,抓住AI时代的机遇。(张伟)

阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • “月季花环”扮靓初夏北京

  • 宁夏贺兰:冷凉蔬菜迎丰收

独家策划

推荐阅读
从日前闭幕的第九届数字中国建设峰会可以看出,我国人工智能技术已迈过能聊天、拼参数的初级阶段,进入会干活、有价值的跃升期。好用,既是用户体验的直观标尺,也是我国人工智能从技术跟跑到创新引领、从规模扩张转向质量提升的关键抓手。
2026-05-08 09:14
4月23日,100多家仪器企业带着自己的拳头产品,参加第十九届中国科学仪器发展年会。一个是以技术创新切入的初创企业,一个是深耕多年的国产老牌厂商,纳析科技和海能技术的实践,正是国产科学仪器企业不断向上突破的缩影。
2026-05-08 09:14
记者日前从中国科学技术大学获悉:近日,该校郭光灿院士团队在实用化量子密钥分发研究方面取得重要进展。团队突破量子态制备和单光子探测技术在高速、高信噪比和集成度方面相互制约的难题,首次利用半导体单光子探测器,实现了超越超导探测系统的安全密钥率纪录。
2026-05-08 09:13
由该校基础医学院教授侯宇领衔的研究团队,首次破解多聚蛋白1在白血病干细胞中驱动免疫逃逸与自我更新的全新机制,
2026-05-08 04:35
这还是那个荒凉的沙漠吗?晴空丽日,10万株玫瑰竞相绽放,花瓣层层叠叠,点缀在沙海边缘。微风拂过,淡淡花香扑面而来……
2026-05-08 04:35
儿童科学本质教育在科学教育中有着举足轻重的作用,发展科学本质观是科学教育的核心目标之一。
2026-05-07 05:35
面对现实世界中日益复杂的预测需求,科研人员围绕大模型预测技术,走出了两大核心主线、四种具体技术路径。
2026-05-07 05:35
人工智能是德国提升国家科技创新能力、竞逐全球科技产业高点的关键领域。
2026-05-07 05:35
该校邢立达课题组与河北省区域地质调查院合作,对河北宣化土城子组两个新的恐龙足迹点展开研究,记录下该地层迄今最慢的兽脚类恐龙行迹,
2026-05-07 06:00
大型体育赛事最令人头痛的当属“最后一公里”:车停到哪里最方便?从哪个入口进场最快捷?如今,这一状况正在改变。
2026-05-07 06:00
在刚刚过去的“五一”假期,“科技游”成为了众多游客的选择。辽宁沈阳航空科技馆则以大量模拟试飞游戏,让孩子们在玩乐中感知复杂的航空技术原理。当技术赋能的展陈体验成为标配,制度与运营模式的创新则为科技馆开辟了新的增长空间。
2026-05-06 09:13
光明日报西安5月5日电 记者李洁、张哲浩5日从中国科学院地球环境研究所获悉,该所联合国内外多家科研机构进行系统研究,提出土壤温度变化是东亚新石器时代粟作农业时空演化的重要调控因素。
2026-05-06 09:10
”日前,中国科学院院士、国家卫生健康委副主任曾益新在“高原重大心肺脑疾病预警关键技术与防治策略研究”项目启动会上表示。曾益新表示,该项目聚焦发病机制、易感人群识别、精准干预、治疗方案四大核心方向,其中发病机制研究是所有工作的基础。
2026-05-06 09:09
为此研究团队开发出纳米高熵陶瓷涂层,集防结焦、耐高温腐蚀、高导热于一体,还能降低煤耗。基于光谱学科基础,研究团队把“吸热”的思路反过来,开发了辐射制冷涂层。以吸热器表面的高温太阳能吸热材料为例,这种关键光学材料一旦断供,国内光热电站将陷入被动。
2026-05-06 09:08
联合国教科文组织5日发布《量子时刻:国际量子科学技术年成果全球报告》,首次对2025年国际量子科学技术年进行了全面评估。
2026-05-06 09:01
董耀会的理想是在全国的长城沿线开发出一万个村,把长城沿线的优质农产品卖到世界各地。
2026-05-02 08:15
习近平总书记强调,要以更大力度、更实举措加强基础研究,提升我国原始创新能力,进一步打牢科技强国建设根基。
2026-05-01 18:40
加强基础研究,建设科技强国的必由之路。
2026-04-30 16:22
“AI投毒”“控评”“互踩”“人肉”“开盒”“算法黑箱”……AI时代,面对这些媒介乱象,该如何约束?
2026-04-30 09:02
近日,国家市场监管总局与教育部联合发布全国首批“专业与标准化教育融合试点单位”名单,位于江苏苏州太仓市的苏州健雄职业技术学院入选。如今,苏州健雄职业技术学院立足太仓“德企之乡”的实际需求,建校20余年来为太仓560余家德企直接输送技能人才或提供相关培训。
2026-04-30 08:59
加载更多