今天,许多 DeepSeek API 用户注意到了 DeepSeek 团队发来的邮件,信中通知 V4 正式版计划在 7 月中旬推出。
信件指出,V4 正式版会包含更多功能改进和性能增强。此外,DeepSeek 还计划在正式版上线后,为了更高效地分配资源、增强服务连续性,对 API 定价政策进行更新,并开始采用峰谷计价模式。
邮件里给出的新定价显示,deepseek-v4-pro 在常规时间的百万 tokens 输入成本是:缓存匹配时每百万 tokens 0.025 元,缓存未匹配时每百万 tokens 3 元;百万 tokens 的输出成本为 6 元。而在高峰时间,这些费用会翻倍,涨到 0.05 元、6 元和 12 元。
deepseek-v4-flash 的价格则更优惠:常规时间百万 tokens 输入成本为缓存匹配每百万 tokens 0.02 元,缓存未匹配每百万 tokens 1 元,输出每百万 tokens 2 元;高峰时段对应费用则分别是 0.04 元、2 元和 4 元。
高峰时间被设定为每天北京时间的 9:00-12:00 和 14:00-18:00,也就是工作日的主要使用时间段,在这些时段 API 调用的费用会是常规时间的一半。
这次费用的调整对企业及开发者影响很大。
重要的是,缓存匹配的价格依然非常低廉。
以 V4 Pro 为例,缓存匹配的输入价格与缓存未匹配的输入价格之间有着显著差异。这表明,持续使用固定的系统提示词、频繁复用长上下文、采用模板化任务方式将继续是控制成本的有效策略。
根据 Vercel 提供的 5 月生产数据,DeepSeek 在其 AI Gateway 转发的全部 tokens 中占比在一月内从不到 1% 上涨至 17%,超过了 OpenAI,成为该网关按 tokens 数量计算的第二大模型提供者。
尽管 DeepSeek 在 AI Gateway 的总支出中只占约 1%,但这些 tokens 主要来自 5 月份推出的 deepseek-v4-flash 和 deepseek-v4-pro。这表明 DeepSeek 主要获取的是低成本、高频率调用的任务,而预算较大的用户则依然选择其他厂商。
DeepSeek 在邮件中还承诺,实际价格调整前 24 小时将通过邮件再次通知用户。如果用户在调整后继续提供服务,就意味着同意新的计费方式;如果不接受,可以选择停止使用并申请全额退款。
从融资到大量招聘,DeepSeek V4 的商业化步伐明显加快。虽然量大管饱依旧是它的核心优势,但今后想要享受优惠,可能需要掌握使用时间的技巧。





