两台运行“满血版”DeepSeek，第四范式推出大模型推理一体机解决方案SageOne IA

来源：东方网 2025-02-18 09:38

来源：

东方网

2025-02-18 09:38　

分享到

分享到微信

今天，第四范式推出大模型推理一体机解决方案SageOne IA，进一步减低了大模型推理成本。如满血版的DeepSeek V3/R1仅需要两台一体机即可使用。此外，一体机解决方案还集成了智能算力池化技术，在支持DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型的基础上，企业可灵活在满血版和多个蒸馏模型之间切换，GPU利用率提升30%以上，推理性能平均提升5-10倍；同时内置大模型应用开发平台，并搭载了丰富的开箱即用AI应用套件，帮助开发者高效开发企业级的生成式AI应用，让企业享受高效的大模型应用服务，加速AI智能化落地进程。

17397842<span style='background-color: #b5d324'>168</span>14640.png

SageOne IA大模型推理一体机解决方案，具备三大核心优势：

1）智能算力池化，资源动态调度，突破物理机架构

传统的物理机架构是单纯的算力堆叠，资源固化使得大模型推理训练任务无法灵活调度，造成GPU资源大量闲置或低效使用。通过业界领先的第四范式GPU资源池化（vGPU）技术，可对算力和显存进行智能切分，对计算任务智能调度，灵活在不同尺寸的大模型中进行切换，GPU利用率提升30%以上。当智算需求增加时，可实现无缝扩展，即插即用。同时，利用多任务共享存储及处理优化技术，推理性能平均提升5-10倍。目前已达到千卡级别分布式调度与管理能力。

2）集成大模型工具链，便捷应用开发

以第四范式大模型工具链为核心的开发平台，包含数百个开放模型服务供给及模型全生命周期管理、可视化workflow流程编排、文档知识自动化解析和向量化存储、Agent智能体框架等，并支持对接业务系统API。融合LLM Ops的理念，使企业开发者可以数周内灵活、快捷搭建企业级的生成式AI应用，开发周期普遍缩短95%以上。

3）内置Sagesuite AI应用套件，众多应用开箱即用

方案支持企业按需选择DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型，还预装了丰富的AI应用套件，包括AIGC、智能办公、数字员工、智能问答、AI本地搜索、分析决策、大模型开发工具、模型仓库、智能体Agent平台、DevOps等，帮助客户快速落地AI并全方位提升AI算力利用价值。

免责声明：该文章系我网转载，旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议，仅供读者参考。

【责任编辑：钟经文】