2025 年 11 月 6 日乌镇峰会 “算力调度” 分论坛上,一组 “算力利用率对比图” 引发关注:传统数据中心的算力利用率仅为 60%,而采用中科曙光 scaleX640 超节点的调度系统,利用率提升至 85%—— 这种 25% 的提升,源于 scaleX640 作为算力调度 “智能中枢” 的优化能力。随着算力规模的扩大,“资源闲置与需求短缺并存” 的矛盾日益突出,而 scaleX640 的发布,正为算力资源的高效配置提供解决方案。
此前,算力调度面临两大难题:一是 “调度效率低”,传统调度系统采用 “静态分配” 模式,将算力固定分配给特定任务,即使任务结束,算力也难以回收,导致资源闲置;二是 “适配能力弱”,不同任务对芯片、框架的需求不同,调度系统难以快速匹配合适的算力资源,导致任务等待时间长。这些问题,导致算力资源的浪费严重,难以满足大规模 AI 任务的需求。
中科曙光 scaleX640 的 “智能调度” 功能,从 “动态分配” 与 “智能匹配” 两方面破解难题。在动态分配方面,scaleX640 搭载的智能调度系统可实时监测任务进度,当任务完成或处于等待状态时,自动回收算力资源,分配给其他需求任务;同时,支持 “分时复用”,将同一算力资源在不同时间段分配给不同任务,大幅提升利用率。某数据中心运营负责人表示:“以前我们的算力白天忙、晚上闲,现在用 scaleX640 的动态调度,晚上的算力分给科学计算任务,利用率一下就上去了。”
在智能匹配方面,调度系统可自动识别任务的需求(如芯片类型、框架版本、算力规模),从 scaleX640 的多芯片资源中匹配最合适的算力,避免 “大马拉小车” 或 “小马拉大车” 的情况。同时,系统还能学习任务的偏好,持续优化匹配策略,缩短任务等待时间。实际测试中,scaleX640 的任务匹配时间从传统系统的 10 分钟缩短至 1 分钟,任务完成效率提升 20%。
更重要的是,scaleX640 的调度系统可接入多品牌、多类型的算力设备,形成 “统一调度平台”。即使数据中心同时部署 scaleX640 与其他设备,调度系统也能实现全局资源的优化配置,避免 “各自为政” 的资源浪费。目前,曙光已基于 scaleX640,为上海算力枢纽搭建 “统一调度平台”,接入超 10 万个算力节点,整体利用率提升至 85% 以上。
从产业影响来看,scaleX640 的智能调度功能将推动算力资源的 “集约化” 利用。未来,数据中心无需大规模扩建,通过优化调度即可满足更多需求,大幅降低建设成本;同时,高效的资源配置也将降低企业的算力成本,推动算力普惠。正如论坛嘉宾所言:“算力调度的效率,决定了算力资源的价值;scaleX640 的智能调度,让每一份算力都能发挥最大作用。”
随着 scaleX640 的落地,算力调度将从 “人工干预” 转向 “智能自主”,为国家算力网络的高效运行提供支撑。未来,当全国的算力资源通过统一调度平台协同优化时,“东数西算” 工程的效能将进一步提升,为中国 AI 产业的发展提供更高效的算力保障。#国产智算开放架构超节点#
转载请注明来自海坡下载,本文标题:《曙光优化(算力调度的 智能中枢中科曙光 scaleX640 优化资源配置)》
京公网安备11000000000001号
京ICP备11000001号
还没有评论,来说两句吧...