商汤大装置发布基于DeepLink的异构混合调度方案，加速国产算力从“可用”迈向“好用”

7月28日，在2025世界人工智能大会（WAIC）期间，商汤大装置发布基于DeepLink的异构混合调度方案，将DeepLink深度融入商汤大装置核心能力体系。该方案针对当前国产算力资源碎片化、异构芯片调度复杂、跨域训练稳定性不足等行业挑战，全面提升异构集群的协同效率与运行可靠性，加速国产AI算力从“可用”迈向“好用”，为大模型训练提供强大而高效的支撑能力。

活动现场，商汤大装置事业群产品总经理卢国强和上海人工智能实验室DeepLink高级解决方案专家王峰在WAIC UP魔盒直播间进行解读，详细介绍了相关的技术原理与产业价值。

【WAIC 2025直播间主题分享】

打通软硬壁垒，构建AI算力协同新路径

DeepLink是由上海人工智能实验室（上海AI实验室）推出的人工智能开放计算体系，其目标是搭建在硬件芯片与深度学习软件框架之间进行适配的桥梁，共建开放的软硬件适配生态。DeepLink把AI芯片与基础框架连接起来，上下游厂商基于DeepLink一次适配即可接入广泛的算法生态，实现软硬件解耦，破除生态壁垒。

当下，大规模集群建设的同时，仍然存在软硬件优化适配不足、资源利用率低、供需失衡等问题。为更好的推进问题解决，上海AI实验室率先探索并研发了DeepLink超大规模跨域混训技术方案，通过训练加速、异构通信、并行策略等核心技术，打破芯片架构差异带来的协同壁垒，重构计算资源调度体系。

今年2月，上海AI实验室联合包括商汤在内的十余家合作伙伴，于上海建成了超大规模跨域混训集群原型，并已在千亿量级参数的自研模型上，完成20天不间断长稳训练，效率达单一芯片集群的90%。 此突破成果为快速实现智算中心互联、支撑超大模型混训提供可行技术保障。其中，商汤大装置为超大规模的混训集群提供了算力调度和管理平台，从而支持了多芯集群的稳定运行。

共建异构算力生态，释放超大规模异构算力集群价值

基于DeepLink的异构混合调度方案的发布，是商汤大装置与上海AI实验室长期协作的重要成果。商汤大装置与DeepLink的深度融合，具备以下特点：

· 多芯片协同调度： 可实现多种国产芯片之间的协同通信与统一调度，并自动进行并行策略优化和负载均衡，真正做到“不同芯片，同一平台”的协同工作，释放异构集群的计算潜力。

· 高效混训，稳定可控： 显著提升了异构调度与弹性算力能力，以秒级弹性伸缩、分钟级故障恢复等，保障大模型训练过程稳定、高效、可控。

· 支持主流模型全流程运行： 方案兼容DeepSeek、InternLM、LLaMA、Qwen等主流大模型，适配稠密模型与MoE架构，支持训练与推理的高效执行。

商汤大装置事业群产品总经理卢国强表示：“通过基于DeepLink的异构混合调度方案，商汤大装置将为更多GPU适配、训练和推理场景扩展、商业化落地提供更强助力。未来，商汤大装置将与上海人工智能实验室持续深化合作，加快国产AI算力芯片的适配与优化，共筑国产AI生态底座，为智能时代的产业升级注入源源不断的技术动能。”

免责声明：该文章系我网转载，旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议，仅供读者参考。

【责任编辑：钟经文】