强推国产算力,Deepseek V4:依旧为开源sota,极致降本情况下的全面领先
强推国产算力,Deepseek V4:依旧为开源sota,极致降本情况下的全面领先【天风计算机缪欣君团队】
建议关注:
AI芯片:华为链+寒武纪(DS官方认证),华为链看好深圳华强、航天电器、华丰科技、恒铭达
CPU:Agent用量提升会极大拉动CPU需求,看好海光信息
交换芯片:盛科通信
服务器:浪潮、华勤
IDC:东阳光、豫能、东方国信
1、全球开源SOTA,推动长上下文进入普惠时代
首先说结论,本次DS V4更新,是围绕长上下文效率优先的架构升级,如官方标题《长上下文进入普惠时代》。目前综合能力为开放模型sota,对比闭源模型为部分指标接近/超越,综合能力落后3~6个月状态。我们认为,V4在Agent、reasonning、coding上达到开源SOTA,对标海外闭源模型,但考虑到推理成本极大下降,称得上全球最顶尖模型这个称号。
2、csa+hca解决长上下文成本,mhc解决超大moe训练稳定性
看核心算法迭代,核心在1)CSA + HCA:是前期研究NSA/DSA 思路上的工程化升级和架构重组,用于压缩kv cache但保持记忆能力,在 1M token 场景下,V4-Pro 单 token 推理 FLOPs 仅为 V3.2 的 27%,KV cache 仅为 V3.2 的 10%;V4-Flash 进一步降低到 FLOPs 10%、KV cache 7%,即体现为推理过程更快、更准。2)mHC:核心解决1.6T MoE架构下,深层网络、稀疏专家、超长上下文同时存在时,训练稳定。此外,后训练阶段用 On-Policy Distillation,OPD,替代原来的 mixed RL 阶段。
3、开源生态持续扩大,#国产算力产业进入正向循环
DeepSeek 延续开放生态策略,V4 有望通过低调用成本、开放权重及主流 API 兼容降低开发者迁移门槛。技术报告披露的 mHC、CSA/HCA 混合注意力、FP4 量化及百万 token 长上下文优化,显示其竞争焦点已从单模型能力延伸至推理效率与系统工程。我们认为,“开源/开放+低价+h国产算力适配”将吸引更多开发者与企业以 DeepSeek 为基座模型,带动推理需求释放并验证国产算力生态商业价值,形成“模型越强—用户越多—算力需求越大—国产芯片迭代越快”的正向循环。
免责声明:本网站提供的所有数据及资讯(包括第三方机构提供的信息)仅作交流学习及参考用途,不构成任何投资建议或交易要约。