Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

来源:东方网    2025-02-11 10:04
来源: 东方网
2025-02-11 10:04 
分享
分享到
分享到微信

Gitee AI 刚刚上线了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四个较小尺寸的 DeepSeek 模型。值得关注的是,本次上线的四个模型均部署在国产沐曦曦云 GPU 上

同时,这次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平台 ,更是实现了从芯片到平台,从算力到模型,全国产研发、中国制造

100%国产AI的力量

国产模型 DeepSeek R1

DeepSeek R1 是一款大型混合专 (MoE)模型,拥有 6710 亿个参数,支持 128000 个 Token 的大输入上下文长度。在数学、代码和自然语言推理等任务上表现出色。

本次部署在沐曦曦云 GPU 上的是四个 DeepSeek R1 蒸馏模型,以更小参数量的资源占用,实现了性能与大参数模型旗鼓相当。

国产 GPU 沐曦曦云

曦云系列通用 GPU 产品(包括 C550、C500、C500X、C290、C280、N260 等型号)采用完全自主研发的 GPU IP,拥有完整的知识产权,并具备强大的多精度混合计算能力及高带宽显存支持。同时,沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈,可广泛应用于智能、通用计算和数据处理等场景。

在本次部署适配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同时得到沐曦的算力供应商超讯通信 的鼎力支持,最终实现了模型的快速部署、稳定调用。

国产平台 Gitee AI

2024 年初上线以来,Gitee AI 平台以 Serverless API、模型引擎、AI 应用为核心功能与服务,致力于让开发者轻松构建和部署 AI 应用,为企业客户提供更加智能、高效的 AI 应用解决方案。

100%国产AI免费跑

目前 Gitee AI 上的DeepSeek-R1-Distill系列模型现已面向全体开发者免费使用!免费使用!免费使用!

本次上线的模型参数虽小,但它们表现并不亚于大参数模型,如下图中的DeepSeek-R1-Distill-Qwen-14B,虽然参数较小,但简单任务相较于大参数模型其响应速度更快,同时也具备体现思考过程的能力:

模型自强、算力自强、平台自强,100%国产AI的新时代已然来临。我们一起在国产 AI 的土壤上,种出下一个时代的参天大树。

访问 Gitee AI,体验基于沐曦算力的 DeepSeek R1,开启你的100%国产AI开发之旅!

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn