强推国产算力，Deepseek V4：依旧为开源sota，极致降本情况下的全面领先

强推国产算力，Deepseek V4：依旧为开源sota，极致降本情况下的全面领先【天风计算机缪欣君团队】

建议关注：

AI芯片：华为链+寒武纪（DS官方认证），华为链看好深圳华强、航天电器、华丰科技、恒铭达

CPU：Agent用量提升会极大拉动CPU需求，看好海光信息

交换芯片：盛科通信

服务器：浪潮、华勤

IDC：东阳光、豫能、东方国信

1、全球开源SOTA，推动长上下文进入普惠时代

首先说结论，本次DS V4更新，是围绕长上下文效率优先的架构升级，如官方标题《长上下文进入普惠时代》。目前综合能力为开放模型sota，对比闭源模型为部分指标接近/超越，综合能力落后3～6个月状态。我们认为，V4在Agent、reasonning、coding上达到开源SOTA，对标海外闭源模型，但考虑到推理成本极大下降，称得上全球最顶尖模型这个称号。

2、csa+hca解决长上下文成本，mhc解决超大moe训练稳定性

看核心算法迭代，核心在1）CSA + HCA：是前期研究NSA/DSA 思路上的工程化升级和架构重组，用于压缩kv cache但保持记忆能力，在 1M token 场景下，V4-Pro 单 token 推理 FLOPs 仅为 V3.2 的 27%，KV cache 仅为 V3.2 的 10%；V4-Flash 进一步降低到 FLOPs 10%、KV cache 7%，即体现为推理过程更快、更准。2）mHC：核心解决1.6T MoE架构下，深层网络、稀疏专家、超长上下文同时存在时，训练稳定。此外，后训练阶段用 On-Policy Distillation，OPD，替代原来的 mixed RL 阶段。

3、开源生态持续扩大，#国产算力产业进入正向循环

DeepSeek 延续开放生态策略，V4 有望通过低调用成本、开放权重及主流 API 兼容降低开发者迁移门槛。技术报告披露的 mHC、CSA/HCA 混合注意力、FP4 量化及百万 token 长上下文优化，显示其竞争焦点已从单模型能力延伸至推理效率与系统工程。我们认为，“开源/开放+低价+h国产算力适配”将吸引更多开发者与企业以 DeepSeek 为基座模型，带动推理需求释放并验证国产算力生态商业价值，形成“模型越强—用户越多—算力需求越大—国产芯片迭代越快”的正向循环。

免责声明：本网站提供的所有数据及资讯（包括第三方机构提供的信息）仅作交流学习及参考用途，不构成任何投资建议或交易要约‌。

发表评论

强推国产算力，Deepseek V4：依旧为开源sota，极致降本情况下的全面领先

猜您喜欢

发表评论

热门话题

热门文章

最新文章

文章归档

链接信息