中国 AI 实验室 DeepSeek 于 4 月 24 日发布 V4 系列首批预览模型:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。两者均为 100 万 token 上下文的混合专家模型,Pro 总参数 1.6T(激活 49B),Flash 总参数 284B(激活 13B),采用 MIT 许可证。
Pro 模型成为最大的开源权重模型,超越 Kimi K2.6(1.1T)和 GLM-5.1(754B)。定价方面,Flash 输入仅 $0.14/百万 token,输出 $0.28/百万 token;Pro 输入 $1.74/百万 token,输出 $3.48/百万 token。DeepSeek 称,在 1M token 上下文下,Pro 的单 token FLOPs 仅为 V3.2 的 27%,KV 缓存为 10%;Flash 更分别降至 10% 和 7%。
看英文原文 →