强推国产算力,Deepseek V4:依旧为开源sota,极致降本情况下的全面领先【天风计算机缪欣君团队】

建议关注:


AI芯片:华为链+寒武纪(DS官方认证),华为链看好深圳华强、航天电器、华丰科技、恒铭达

CPUAgent用量提升会极大拉动CPU需求,看好海光信息

交换芯片:盛科通信

服务器:浪潮、华勤

IDC:东阳光、豫能、东方国信


1、全球开源SOTA,推动长上下文进入普惠时代

首先说结论,本次DS V4更新,是围绕长上下文效率优先的架构升级,如官方标题《长上下文进入普惠时代》。目前综合能力为开放模型sota,对比闭源模型为部分指标接近/超越,综合能力落后36个月状态。我们认为,V4Agentreasonningcoding上达到开源SOTA,对标海外闭源模型,但考虑到推理成本极大下降,称得上全球最顶尖模型这个称号。


2csa+hca解决长上下文成本,mhc解决超大moe训练稳定性

看核心算法迭代,核心在1CSA + HCA:是前期研究NSA/DSA 思路上的工程化升级和架构重组,用于压缩kv cache但保持记忆能力,在 1M token 场景下,V4-Pro token 推理 FLOPs 仅为 V3.2 27%KV cache 仅为 V3.2 10%V4-Flash 进一步降低到 FLOPs 10%KV cache 7%,即体现为推理过程更快、更准。2mHC:核心解决1.6T MoE架构下,深层网络、稀疏专家、超长上下文同时存在时,训练稳定。此外,后训练阶段用 On-Policy DistillationOPD,替代原来的 mixed RL 阶段。


3、开源生态持续扩大,#国产算力产业进入正向循环

DeepSeek 延续开放生态策略,V4 有望通过低调用成本、开放权重及主流 API 兼容降低开发者迁移门槛。技术报告披露的 mHCCSA/HCA 混合注意力、FP4 量化及百万 token 长上下文优化,显示其竞争焦点已从单模型能力延伸至推理效率与系统工程。我们认为,开源/开放+低价+h国产算力适配将吸引更多开发者与企业以 DeepSeek 为基座模型,带动推理需求释放并验证国产算力生态商业价值,形成模型越强用户越多算力需求越大国产芯片迭代越快的正向循环。


免责声明:本网站提供的所有数据及资讯(包括第三方机构提供的信息)仅作交流学习及参考用途,不构成任何投资建议或交易要约‌。