点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:百度智能云点亮昆仑芯三代万卡集群
首页> 经济频道> 光明经济 > 正文

百度智能云点亮昆仑芯三代万卡集群

来源:光明网2025-02-05 14:33

  近日,百度智能云成功点亮昆仑芯三代万卡集群。据悉,百度智能云将进一步点亮3万卡集群。

  万卡集群优势凸显,助力算力突破与成本优化

  万卡集群的建成不仅为百度带来了强大的算力支持,还推动了模型降本的趋势。在过去一年中,整个行业都在努力降低大模型的使用成本,而算力紧张是导致成本居高不下的重要因素之一。百度通过自研芯片和大规模集群的建设,不仅解决了自身算力供应的问题,还为整个行业提供了新的思路和方向。

  从算力上看,超大规模并行计算能力可实现训练效率跃升,万卡集群可将千亿参数模型的训练周期大幅降低,满足AI原生应用快速迭代的需求。同时也能支持万亿参数模型、复杂任务和多模态数据。此外,万卡集群能够支持多任务并发能力,通过动态资源切分,单集群可同时训练多个轻量化模型,通过通信优化与容错机制减少算力浪费,实现训练成本指数级下降。

  随着国产大模型的兴起,万卡集群逐渐从“单任务算力消耗”到“集群效能最大化”过渡,通过模型优化、并行策略、有效训练率提升、动态资源分配等手段,智能调度任务,将训练、微调、推理任务混合部署,从而提升集群综合利用率,降低单位算力成本。

  百舸赋能,全方位提升集群性能与稳定性

  过去,多芯混训和激增的故障率等难题,成为万卡集群部署过程中的巨大挑战。而2024年9月升级的百度百舸AI异构计算平台4.0,在万卡集群的建设中发挥了至关重要的作用。

  首先,突破硬件扩展性瓶颈,如卡间互联的拓扑限制,避免通信带宽成为瓶颈;同时,围绕芯片及集群功耗,基于万卡规模常规方案功耗可达十兆瓦或更高,采用创新性散热方案,从而解决万卡集群的能效与散热问题;完善模型的分布式训练优化,采用高效并行化任务切分策略,训练主流开源模型的集群MFU提升至58%;在提升稳定性方面,提供容错与稳定性机制,避免由于单卡故障率随规模指数上升而造成的万卡集群有效性大幅下降,保障有效训练率达到98%;最后,针对机间通信带宽需求,建设超大规模HPN高性能网络,优化拓扑结构,从而降低通信瓶颈,带宽有效性达到90%以上。

  日前,花旗银行发布研报表示,DeepSeek、百度等中国模型展现出高效和低成本优势,将有助于加速全球AI应用开发,并在全球引发更多技术创新,推动2025年人工智能应用的拐点。中国工程院院士、清华大学计算机系教授郑纬民也表示,当下构建国产自主万卡系统充满挑战,但“至关重要”。(李京)

阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 回放:“巳巳如意中国年”短视频征集活动分享交流会

  • 喜迎新学期

独家策划

推荐阅读
农业农村部近日制定印发《全国农业科技创新重点领域(2024—2028年)》,要求聚焦十大重点领域,加快推进高水平农业科技自立自强。
2025-02-17 10:16
2024年,中国智能算力规模达725.3百亿亿次/秒(EFLOPS),同比增长74.1%,增幅是同期通用算力增幅(20.6%)的3倍以上;市场规模为190亿美元,同比增长86.9%。
2025-02-17 10:14
我国第三代自主超导量子计算机“本源悟空”全球访问量突破2000万次,刷新了我国自主量子算力服务规模纪录。
2025-02-17 10:14
一部优秀的动画片,需要艺术和技术的高度合一。而《哪吒2》在本土先进动漫制作技术的托举之下,实现了这种合一。它的成功,是我国文化软实力和电影科技硬实力的并肩胜出和双重出圈,昭示着文化与科技碰撞产生的巨大张力。
2025-02-17 10:12
科普法第五十一条规定,利用财政性资金设立科学技术计划项目,除涉密项目外,应当结合任务需求,合理设置科普工作任务,充分发挥社会效益。
2025-02-17 10:11
成都大熊猫繁育研究基地科普团队成立于2000年,旨在面向公众传播以大熊猫为代表的生物多样性保护理念。
2025-02-14 10:26
食品添加剂是指为改善食品品质和色、香、味,以及为防腐和加工工艺的需要而加入食品中的化学合成或者天然物质。
2025-02-14 10:24
《自然》杂志13日报道我国发现迄今唯一确切的侏罗纪鸟类——政和八闽鸟。
2025-02-14 10:23
在当前的极寒天气下,机器狗更灵活、可携带更多仪器,巡检质效显著提高,让赛事电力保供更安心。
2025-02-14 10:22
国家税务总局发布的最新数据显示,2024年,现行支持科技创新和制造业发展的主要政策减税降费及退税达26293亿元,助力我国新质生产力加速培育、制造业高质量发展。
2025-02-14 10:11
独脚金是寄生在高粱上的一种植物,能导致高粱减产甚至死亡。近日,我国科学家首次从高粱中发现两个关键基因,敲除后,高粱对独脚金的抗性显著提高。
2025-02-14 10:04
基于AI大模型及领域数据资源,构建基于PC端和手机端应用的科特派数字人“小科”,为用户提供随时在线、多终端访问、7×24小时全天候资源对接,全方位服务于北京城市科技创新与管理。
2025-02-13 09:36
新时代以来,我国以更高站位、更宽视野、更大力度来谋划和推进新征程生态环境保护工作,全力推动生态环境根本好转。
2025-02-13 03:40
新年伊始,DeepSeek成为“热词”,其在各领域的应用也引发思考和讨论。在科研领域,人工智能驱动科学研究的新科研范式随之到来,对构建开放创新生态提出了更急迫的要求。
2025-02-13 03:50
从个性化的珠宝饰品到复杂的航空零部件,3D打印展现出了巨大的创造力和应用潜力。然而,科技的探索永无止境,一种比3D打印更具突破性的技术——4D打印,正悄然兴起。
2025-02-13 03:50
当前,我国经济已由高速增长阶段转向高质量发展阶段,对生态环境的要求也越来越高。良好的生态环境不仅是自然财富、生态财富,更是经济财富、社会财富。
2025-02-13 03:40
中国人工智能发展与安全研究网络主办,上海期智研究院、清华大学人工智能国际治理研究院承办
2025-02-12 19:16
2025年,空天院合成孔径雷达科研团队将继续研制8颗“女娲星座”合成孔径雷达卫星,届时“女娲星座”20颗在轨雷达卫星将实现全球组网运行,对地观测能力将大幅提升。
2025-02-12 10:07
这并不是一辆普通的复古电车,而是一部使用了16K全息数字技术、AI技术与四轴动感震动系统的数字电车。
2025-02-12 10:06
科学家们发现,水波涉及复杂的流体力学效应,能够构造丰富的拓扑矢量场用于粒子的操控。
2025-02-12 09:59
加载更多