Gitee AI与沐曦携手首发DeepSeek R1系列千问蒸馏模型,国产GPU强势助力

   时间:2025-02-05 04:00 来源:ITBEAR作者:杨凌霄

近日,Gitee AI 正式推出了四个轻量级版本的 DeepSeek 模型,分别为 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B 和 DeepSeek-R1-Distill-Qwen-32B。尤为引人注目的是,这些模型均部署在国产沐曦曦云 GPU 上,标志着我国在人工智能领域的自主研发能力又迈出了坚实的一步。

相较于全尺寸的 DeepSeek 模型,这些轻量级版本的蒸馏模型在保持高性能的同时,显著降低了资源占用和部署成本,更适合企业内部的应用和部署需求。这一举措无疑将推动人工智能技术在更多行业和企业中的普及和应用。

本次 Gitee AI 的 Deepseek R1 模型与沐曦曦云 GPU 的结合,不仅展现了从芯片到平台、从算力到模型的全方位国产研发实力,更为我国人工智能产业的发展注入了新的活力。DeepSeek R1 作为一款拥有 6710 亿个参数的大型混合专家(MoE)模型,其支持的大输入上下文长度达到了 128000 个 Token,性能卓越。

而此次部署在沐曦曦云 GPU 上的四个 DeepSeek R1 蒸馏模型,更是以较小的参数量实现了与大参数模型相当的性能表现,这无疑将进一步提升人工智能技术的效率和实用性。

为了让更多开发者能够享受到这一技术成果,Gitee AI 目前已将 DeepSeek-R1-Distill 系列模型面向全体开发者免费开放。这一举措无疑将激发更多开发者的创新热情,推动人工智能技术在更广泛的领域得到应用和发展。

 
 
更多>同类内容
全站最新
热门内容