deepseek 黑科技 ‌KV Cache‌（键值缓存）

性能直接对标国际顶级闭源模型。 V4-Pro在数学、STEM、竞赛型代码测评中完胜所有已公开开源模型。AIME 2026数学推理拿下99.4%（V4-Pro-Max），MMLU通用知识评测达92.8%，HumanEval编程测试达90%，Agent能力直接对标Claude Opus 4.6。（来源：DeepSeek官方发布）

算力效率更令人振奋——V4-Pro在1M超长上下文下，单token推理计算量仅为V3.2的27%，KV Cache仅为10%；V4-Flash更极致，双双压至10%和7%。用不到三分之一的算力，跑足八倍上下文。

deepseek 黑科技 ‌KV Cache‌（键值缓存）是加速大型语言模型自回归推理的核心优化技术，通过将已计算的键值向量缓存复用，将注意力计算复杂度从 O(N²) 降至 O(N)，在序列长度 2048 时推理加速比可达 32.6 倍