6月25日,海光信息与同济大学在上海签署了战略合作协议,双方共同启动了国内首个国产千卡级工科智算集群的建设工作。这项合作聚焦于人工智能技术如何赋能工程教育、工程科研以及产业创新,为高校和产业界提供了科研与应用协同的新实践范例。同济大学·海光信息千卡集群启动仪式观察者网 这次集群的建设,基于海光CPU和GPU/DCU的“双芯”算力架构以及融合式设计,专门针对AI4E(AI for Engineering)场景进行了优化。集群能够支持人工智能的训练与推理、科学计算、工程仿真等多样化应用。与传统的通用算力平台相比,这个工科智算集群特别强调工程软件的兼容性与迁移,对算力底座的兼容性、适用性及稳定性提出了更高要求,其主要服务领域涵盖桥梁设计、建筑设计、汽车研发、海洋工程以及CAD/CAE等实际工程领域。
同济大学党委书记、中国工程院院士郑庆华在致辞时强调,人工智能的发展严重依赖于数据、算力和算法这三个基本要素,其中算力作为基础平台发挥着核心作用。高校在国家战略科技力量中扮演着重要角色,它们在学科建设、人才培养以及科学研究中对人工智能技术的需求日益增强。同济大学和海光信息合作打造国产千卡集群,目的是为了更好地支持人工智能技术在学科创新中的应用,并为学校未来的发展提供强大的高性能计算和智能计算平台。
海光此前在郑州国家超算互联网核心节点探讨了AI4S(AI for Science)的应用,而这次的合作则将重点放在AI4E方向。虽然两者都是国产算力面向人工智能应用的重要方向,但它们对平台能力的要求有所不同。AI4S在处理大模型训练时对规模的需求更为接近,许多科学计算任务遵循Scaling Law,因此对系统的规模扩展、互联关系以及整体调度能力提出了较高要求。传统科学计算多采用高精度模式,以64位精度为主,但随着人工智能技术在科学计算中的融合,混合精度计算越来越普遍,以平衡计算精度与算力效率。
与AI4S不同,AI4E对规模大小没有苛刻要求,但考虑到工程计算场景长期积累的商业软件和历史代码,涉及从CAD到CAE、Fluent等不同领域的软件应用,AI4E平台不仅要支持高精度的工程计算,还必须提供适合工程软件迁移和转化的环境,因此,可迁移性、可移植性、实时性和应用适配效率成为评价AI4E平台的关键指标。
同济千卡集群的成功部署,是国产算力从传统的科学计算支持向工程科研和工程软件生态适配领域拓展的重要探索。海光信息总裁沙超群指出,以往高校在进行算力应用时普遍遇到适配困难、迁移成本高、算力支持不足等问题,将这些应用迁移到国产算力平台上,需要底层架构的兼容性、主流开发生态的适配性、算子、库和运行时的优化,以及源码迁移机制的共同支持。
得益于海光CPU/DCU“双芯”算力底座,海光一方面通过延续x86架构和兼容主流开发生态来降低适配难度,另一方面针对不同计算密集型、数据密集型和通信密集型的工程场景优化系统性能,从而提升既有工程应用在国产算力环境中的适配效率和运行稳定性。海光信息副总裁吴宗友向观察者网表示,此次与同济大学的合作不仅仅是一纸合同,而是一种深度的产业结合。合作的核心是学校能够将应用需求反馈给企业,企业则基于这些需求调整整个系统的能力。通过前期的充分交流,双方能够提供更符合定制化需求的系统,从而使用户获得更高的应用效率。他还透露,未来海光将和高校以工程应用为起点,在同济大学内部拓展更多合作领域,并逐步向其他高校开展更深层次的合作。
随着AI应用逐渐深入,沙超群指出CPU将在智能体编排、上下文调度、任务记忆和算力资源管理等方面承担更多职责。他预测,未来的AI算力竞争将不再局限于单颗GPU的较量,而是CPU、DCU、互连技术、网络、存储以及整机系统共同构建的系统级能力较量。针对国产算力系统的未来发展,海光提出了提升系统能力、开放生态和软硬件协同三大策略。沙超群表示,海光将依托CPU、DCU“双芯”算力架构,





