中科曙光新一代集群管理系统:Gridview 7.0智能体版本于5月1日正式启动公测。本次公测将持续至2026年6月30日,面向有新装集群管理系统或老版本升级需求的行业用户开放。
Gridview可提供集群全场景运营与运维管理能力,涵盖作业调度、集群状态实时诊断、集群监控管理、超智融合计算等核心功能。系统集成上百款应用及模板,旨在降低用户使用门槛,实现高效便捷的集群管控,其核心模块已应用于scaleX万卡超集群系统。
Gridview 7.0围绕“易用、稳定、智能、全面”四大方向实现能力突破,致力于为科研、工业制造、企业算力中心等多元用户提供全链路智能化的集群管理新体验。
双智能体驱动,迈向“自然语言交互+全流程自动化”
Gridview 7.0智能体版本全面增强AI能力,并通过“材料计算智能体”与“运维智能体”两大核心智能体,分别赋能科研创新与集群运维。
材料计算智能体:专为科研用户打造,支VASP、QuantumEspresso、Gaussian等主流量子化学与第一性原理计算软件,覆盖能带计算、电子亲和能、弹性模量等100+科研场景。用户可通过自然语言直接发起任务(例如“分析SiC的能带结构”),系统自动完成目标拆解、软件匹配、输入文件生成、结果可视化与报告生成,大幅降低科研门槛,提升计算效率。

运维智能体:用户可通过自然语言对话发起运维指令(如“总结集群主要故障”“分析作业运行失败原因”),实现零门槛运维。基于多智能体协同机制,支持从集群状态检索、根因分析、日志审查到命令行执行等多类运维场景的端到端自动化流程,并结合企业级知识库与工作流模板,为故障分析、配置检查提供精准决策支撑。
此外,Gridview 7.0还将持续扩展行业智能体生态,未来将陆续上线生物信息、工业仿真、气象、地学等领域的专用智能体,覆盖RNA差异分析、流体力学仿真、气象预报、论文辅助写作等100+行业计算场景。
集群管理能力革新,超智融合实现全域算力统一调度
Gridview 7.0在底层架构与管理能力上同样实现突破:
全新搭载Slurm与Kubernetes双调度融合架构,实现全域算力统一调度、集中管控,高效打通传统高性能计算与人工智能两大核心业务场景,有效打破算力孤岛。破除算力孤岛与场景壁垒,实现多元业务无缝衔接、协同运行。
深度适配新一代国产芯片、高性能加速卡、scaleFabric国产高速网络、超节点等硬件,全面兼容ARM等多架构体系,全面扩容国产化硬件生态适配能力,为各行业筑牢坚实信创底座。
支持单集群、多集群、混合云等复杂部署形态,升级组织架构精细化管理体系,强化分级授权、权限隔离、资源统筹等核心能力,精准适配科研、工业制造、算力中心等复杂业务架构,满足规模化、集团化的资源管控与运维管理需求。

基础能力与运维体系智能化、国产化协同升级
在HPC基础能力方面,Gridview 7.0完成了与主流国产三维可视化厂商的生态对接,集成远程三维可视化服务,覆盖仿真建模、工业设计、科研可视化等场景,构建“国产硬件+国产软件”一体化解决方案。同时,对数据管理、作业提交与监控等核心环节进行了深度优化,以更好适配制造、仿真等行业场景,并全面满足分保2.0等合规要求,为业务优化提供数据支撑。
新版本还实现了AI驱动全流程自动化。除了通过内置智能助手实现自然语言运维,新版本还覆盖从Notebook开发、模型训练到推理服务部署的AI全流程,并推出可视化智能运维平台,打通“存-算-网-传-管”超大规模集群运维管理体系,打造新一代智能运维体验。
共赴大规模计算智能管理新篇章
Gridview始终聚焦大规模计算集群全链路管理需求,持续以智能化技术迭代产品能力。本次公测诚邀全行业用户深度参与体验,共同打磨贴合实际业务、适配多元算力的智能化解决方案,以用户反馈驱动产品优化,携手共建高效、稳定、智能的大规模计算管理新生态。
公测期间,成功报名的用户不仅可以免费部署试用新版本,还有机会享受千万Tokens福利。


