云天励飞 GPNPU 架构与 IFWA完成 DeepSeek-V4 关键机制适配验证

4月24日,DeepSeek-V4 系列模型发布。围绕该模型 CSA/HCA 混合注意力机制带来的新型计算需求,云天励飞依托自研 GPNPU 架构及 IFWA 智能融合软件栈,通过 PyTorch 插件 torch_ifwa,完成了面向 GPNPU 平台的关键机制适配验证。此次适配验证主要面向 DeepSeek-V4 中 CSA/HCA 混合注意力机制...
DeepSeek-V4 模型对中国互联网巨头模型格局的影响

✨ 以 DeepSeek-V4 今日发布为代表的中国开发者 AI 模型快速迭代,凸显了当前竞争格局的特点。💬 我们认为市场领先并非 “赢者通吃”,成功的关键因素将更多是商业化策略、持续用户采纳以及通过 API、代币使用和基础设施服务产生收入。🏢 企业或将采取务实的多模型策略,根据对质量、能力和成本的细致评估,为特定任务选择最佳工具。🔧 差异化的技术路径...
强推国产算力,Deepseek V4:依旧为开源sota,极致降本情况下的全面领先

强推国产算力,Deepseek V4:依旧为开源sota,极致降本情况下的全面领先【天风计算机缪欣君团队】建议关注:AI芯片:华为链+寒武纪(DS官方认证),华为链看好深圳华强、航天电器、华丰科技、恒铭达CPU:Agent用量提升会极大拉动CPU需求,看好海光信息交换芯片:盛科通信服务器:浪潮、华勤IDC:东阳光、豫能、东方国信1、全球开源SOTA,推...
DeepSeek-V4全面适配华为昇腾,美团万亿模型国产算力独训引爆国产算力新纪元

2026年4月24日,DeepSeek官方正式发布了新一代旗舰模型——DeepSeek-V4预览版本,并同步开源。据官方介绍,V4系列包含两个MoE(混合专家)模型:DeepSeek-V4-Pro总参数高达1.6万亿、激活参数49B,DeepSeek-V4-Flash总参数284B、激活参数13B,两者均原生支持100万token超长上下文。在Agen...