- 注册时间
- 2024-7-16
- 最后登录
- 2025-4-14
- 阅读权限
- 90
- 积分
- 4430
- 精华
- 0
- 帖子
- 210
|
引用:作者: 心生明媚 发表于 2025-2-25 08:59 ![]()
工信厅通信函〔2025〕55号 四、应用
(十二)智算中心跨域互联应用
揭榜任务:优化人工智能算力基础设施布局,构建跨地域互补、协同算力调度的超大规模人工智能算力服务能力。加强与人工智能芯片厂商的兼容适配,构筑大规模高性能异构算力池,提供面向大模型训推场景深度优化的弹性调度、弹性容错、高资源利用率的人工智能算力服务。
预期目标:到2026年,形成覆盖5个以上全国重点算力枢纽节点的人工智能算力中心,支持跨地域、跨云的算力需求感知和动态调度,完成3款以上算力芯片适配,聚焦大模型训练和推理场景,构建大规模、高性能、弹性调度、高容错的训推一体算力资源池,具备分钟级断点续训能力,支持万卡级别并行训练。
(十三)算力电力协同应用
揭榜任务:研发基于算力调度技术与能源大模型的多云异构算电协同管理平台,构建基于数据驱动的算力集群用电负荷特性模型、基于计算任务的时空转移特性的能源大模型,推动算力预测与调度技术在智算中心应用落地,提升整体资源利用率,基于新能源、新型储能系统开展算力负荷与电力系统的协同优化,实现精准、动态、实时的能源调度与交易,实现算力与电力等能源的深度协同。
预期目标:到2026年,实现智算场景下能源与算力全链路的数据穿透及流程整合,构建“算”随“电”动的直接控制及间接引导机制,实现算力需求预测精准度达到70%、集群有效负载率提升25%以上,智算中心整体集群资源利用率提高10%。结合算力集群用电数据、时间周期、气象数据、工作负载等多种因素,实现“电”随“算”用的能源效率优化与算效提升,实现基础设施用能决策精准度85%以上,响应时效性达到提前15分钟响应级别,智算中心整体算力能效水平提升30%,算力中心用电成本降低5%以上。
(十四)大规模通信业务场景中的算力应用
揭榜任务:围绕网络功能虚拟化(NFV)系统架构,针对NFV中网络性能、资源利用和灵活展性等方面的挑战,研发面向NFV架构的高性能虚拟化、智能化网络管理和资源编排算法等技术和系统,突破虚拟化层与硬件加速器(如FPGA、DPU、GPU)之间的协同能力。
预期目标:到2026年,NFV算力平台系统中实现对虚拟化网络功能的智能调度,支持异构集群部署、动态扩展,资源动态分配,虚拟化资源利用率提升20%以上;支持GPU、FPGA等硬件加速器的虚拟化调度,加速网络处理性能至Tbps以上;支持智能化网络虚拟化功能管理,提升NFV系统的自动化运维能力和管理效能,故障修复时间缩减不低于30%。
五、绿色低碳
(十五)绿色算力技术研究及应用
揭榜任务:围绕算力的绿色节能技术突破,面向算力中的任务调度特性、能源使用模式、负载均衡要求等关键要素,研发适应于绿色计算的动态资源调度算法、能耗优化管理系统,以及面向多场景的协同节能机制,突破节能算法的智能化程度,提升算力网络中多节点的能源利用效率。
预期目标:到2026年,能耗管理系统实现对算力中心和网络节点的实时监控与节能调度,通过计算节点支持动态调频、动态电压调节,单节点平均能耗降低30%以上,满足AI推理等应用需求。
(十六)企业绿色计算碳感知平台
揭榜任务:建立企业算力中心碳排放度量体系,能够实时、精准地统计企业各个算力中心碳排放,并能将碳排放量分摊到不同的业务部门、应用场景和工作负载,实现精细化的碳排放的管理。同时,基于碳排放的数据,实现碳感知调度能力,通过在保证业务体验和连续性的情况下将工作负载调度到更加低碳的算力中心,进一步降低碳排放。
预期目标:到2026年,围绕千万核级别跨域的算力中心,构建企业级绿色计算碳感知平台,形成一套行业通用的、可精确度量不同类型工作负载碳排放的技术方法和指标体系,通过生态共建形成绿色度量衡标准体系。构建碳感知调度能力,达到算力中心可再生能源比例30%的目标。
(十七)冷板式液冷原生整机柜服务器
揭榜任务:面向新一代液冷算力中心,研发冷板式液冷整机柜,包括液冷服务器节点、无源液冷门等,突破高密算力、多样性算力的散热技术及架构要求,实现支持供电总线、网络互联总线、液冷管路可盲插运维的液冷设备,具备液冷机柜及液冷服务器等多级漏液检测能力,有效降低业务中断范围与损失。
预期目标:到2026年,液冷整机柜实现100%液冷散热,制冷PUE低于1.15。整机柜服务器内部实现全盲插设计,管理模块可实现整机柜功耗管理、漏液检测、资产管理等功能;通用算力单柜功率不低于20kW,智能算力单机柜功率不低于30kW,实现不少于500台液冷节点的规模落地应用。
(十八)算力中心节能调优平台
揭榜任务:研制高精确度、高仿真效率、多场景覆盖的算力中心PUE仿真平台,突破物理机理模型构建、仿真引擎集群、模型自动生成等关键技术,实现对算力中心不同运行状态下细分时间颗粒度PUE的快速、精准评估。研发基于大数据分析技术的算力中心制冷系统AI节能优化系统,通过自动化数据治理、自动推理等关键技术,准确匹配制冷需求,在满足可靠性要求条件下实现算力中心制冷系统整体动态实时优化,优化算力中心PUE。
预期目标:到2026年,支持液冷、水冷等至少2类典型制冷场景进行能效优化,支持制冷系统和配电系统联合仿真,系统可输出不同负载及运行工况条件下的PUE运行曲线、系统设备运行模拟工况等参数,PUE仿真精度达到97%以上。基于能效优化平台,支持AI自动推理,小时级策略自动下发,实现对算力中心能耗的可视、可管、可控。通过AI能效优化,实现算力中心PUE降低5%以上,通过算力中心基础设施与IT联动节能,实现总能耗降低5%以上,在5个以上算力中心落地应用。
(十九)新型制冷系统
揭榜任务:研发人工智能节能系统,针对算力中心基础设施的运行调控和环境监测。提出全新自适应算法,突破原有常见算法的局限性,提升数据的分析和处理效果,搭建基于专家经验的人工智能算法数据库,提升包括能耗管理、能源调度、安全监测、故障诊断、辅助运维等功能的节能性、可靠性、经济性。
预期目标:到2026年,在满足制冷要求的基础上,提高冷却系统的可靠性和自适应性,提高能源使用效率、水资源使用效率和运维效率,其中节电率提升10%以上。支持冷却系统数据采集、标注、治理、存储,具备系统运行异常告警、告警收敛、自动诊断、远程通信、自动控制等功能,支持冷却系统智能化调优、智能化控制的核心能力,并开展不少于5个实际业务场景所提供的AI节能调优案例。
六、安全可靠
(二十)算力中心智能运维机器人
揭榜任务:研发算力中心智能运维机器人以及智能机器人管理平台,基于云边端三层架构,实现智能机器人在多层、多房间楼宇机房内的设备设施识别、多模态环境感知、精准空间定位、智能人机协同、多任务联合调度等方面的技术与算法优化。支撑机器人在算力中心设施运维和IT运营等典型场景的应用,提升巡检质量,促进算力中心运维、运营的降本增效。
预期目标:到2026年,实现大型算力中心内智能机器人的多机房、多楼层协同应用部署;机器人巡检任务成功率不低于95%,设备识别准确率达到97%,环境巡检召回率不低于90%,保障算力中心巡检业务持续运行。实现云边端协同调度,支持不同场景下的自主作业,提高任务并发执行效率,促进稳定、安全、可靠、可控的算力中心智能运维体系建设。
(二十一)云边端一体化智能监测平台
揭榜任务:开发高性能云边端一体化系统,研发以智能化终端或机器人为硬件载体、以多算法模型融合和平台工具为软件载体的软硬结合的集中监测管理与运维巡检方案。突破多层级自动化运维、多维度诊断、多平台覆盖、多模型量化等关键技术。构建综合运维健康度数字化评估体系与模型,实现算力设施从规划、设计、建设、部署、运行、维护的全生命周期数字化管理。
预期目标:到2026年,建立大规模集群的智能化运维能力,设备实现跨平台及系统稳定性风险和安全风险识别能力,综合视频识别技术等,结构化告警收敛推送,准确率超过98%。算力设施全生命周期数字化联动,平台自动化流程推进,实现云端直控覆盖超10栋算力中心,落地数字化算力中心健康度评估,智能化终端或机器人的自驱动巡检,视频流识别与告警的联动,系统的智能化运维问答,并保障业务服务级别协议(SLA)达标率99%以上。
七、其他
(二十二)其他算力领域的特色化技术、产品、服务和平台等,应具有技术先进性,技术成熟度较高,产业化前景较好。 |
|