性能直接对标国际顶级闭源模型。 V4-Pro在数学、STEM、竞赛型代码测评中完胜所有已公开开源模型。AIME 2026数学推理拿下99.4%(V4-Pro-Max),MMLU通用知识评测达92.8%,HumanEval编程测试达90%,Agent能力直接对标Claude Opus 4.6。(来源:DeepSeek官方发布)

算力效率更令人振奋——V4-Pro在1M超长上下文下,单token推理计算量仅为V3.2的27%,KV Cache仅为10%;V4-Flash更极致,双双压至10%和7%。用不到三分之一的算力,跑足八倍上下文。

deepseek 黑科技 ‌KV Cache‌(键值缓存)是加速大型语言模型自回归推理的核心优化技术,通过将已计算的键值向量缓存复用,将注意力计算复杂度从 O(N²) 降至 O(N),在序列长度 2048 时推理加速比可达 32.6 倍

免责声明:本网站提供的所有数据及资讯(包括第三方机构提供的信息)仅作交流学习及参考用途,不构成任何投资建议或交易要约‌。