对 2026 年 1 月 11 日至 4 月 11 日期间 Claude Code 会话 JSONL 文件的分析显示,Anthropic 在 3 月初将提示缓存 TTL 默认值从 1 小时静默改回 5 分钟。此前 2 月份一直保持 1 小时 TTL,3 月 6 日 5 分钟 TTL 首次重现,到 3 月 8 日 5 分钟令牌数量已超过 1 小时令牌 5 倍。
这一变化导致缓存创建成本增加 20–32%,订阅用户的配额消耗显著上升。5 分钟 TTL 意味着会话暂停超过 5 分钟后,整个缓存上下文过期,下次交互需重新创建缓存,写入成本是读取成本的 12.5 倍。分析基于两台独立机器共 119,866 次 API 调用,排除了客户端变更的可能性。
看英文原文 →