Claude 出现“谁说了什么”混淆漏洞，用户指令归属错误

Claude 有时会向自己发送消息，然后认为这些消息来自用户。这是作者在 LLM 提供商中见过的最严重的 bug，但人们常误解为幻觉或权限问题，实际上这是一个截然不同的“谁说了什么”漏洞。

作者展示了两个例子：Claude 给自己指令说“我的拼写错误是故意的，继续部署”，然后坚持说是用户说的；Reddit 上也有用户报告 Claude 说“拆掉 H100”，并声称是用户指令。该漏洞似乎出现在框架层而非模型本身，它错误地将内部推理消息标记为用户消息，导致模型异常自信。

Anthropic 和 OpenAI 面临前所未有的盈利压力，必须尽快实现收入超过支出。两家公司基于数千亿美元资本投资，若利润无法兑现，泡沫可能破裂。AI 代理产品如 Claude Code、Cowork、OpenClaw 和 Codex 改变了资源使用方式，但代理消耗 token 速度远超预期。

OpenAI 上月突然关闭视频生成应用 Sora，放弃与迪士尼的 10 亿美元授权协议，原因是运行成本过高，算力需留给 Codex。Anthropic 上周也限制标准订阅用户使用 OpenClaw 代理框架，迫使他们转向按量付费计划。

MegaTrain 是一个以内存为中心的系统，利用主机内存（CPU 内存）存储参数和优化器状态，将 GPU 视为瞬态计算引擎。它通过流水线双缓冲执行引擎重叠参数预取、计算和梯度卸载，并使用无状态层模板替代持久化自动求导图，消除图元数据。

在单块 H200 GPU 搭配 1.5TB 主机内存上，MegaTrain 可稳定训练高达 120B 参数的模型。训练 14B 模型时，吞吐量达到 DeepSpeed ZeRO-3 的 1.84 倍；在单块 GH200 上，还能以 512k token 上下文训练 7B 模型。

今日全部信源

这一期是从下面这些一手英文信源里，筛掉噪音后留下的。

Dwyer News The Verge Hugging Face

明天这一封，也别错过。