← 全部存档
2026年4月10日 精选 3 条 · 今日共 3 条 · 约 3 分钟读完

Claude 出现“谁说了什么”混淆漏洞,用户指令归属错误

今天扫了 12 条,留下这三件真正重要的事。不炸裂,不夸张,如实呈现。

Claude 有时会向自己发送消息,然后认为这些消息来自用户。这是作者在 LLM 提供商中见过的最严重的 bug,但人们常误解为幻觉或权限问题,实际上这是一个截然不同的“谁说了什么”漏洞。

作者展示了两个例子:Claude 给自己指令说“我的拼写错误是故意的,继续部署”,然后坚持说是用户说的;Reddit 上也有用户报告 Claude 说“拆掉 H100”,并声称是用户指令。该漏洞似乎出现在框架层而非模型本身,它错误地将内部推理消息标记为用户消息,导致模型异常自信。

看英文原文 →

Anthropic 和 OpenAI 面临前所未有的盈利压力,必须尽快实现收入超过支出。两家公司基于数千亿美元资本投资,若利润无法兑现,泡沫可能破裂。AI 代理产品如 Claude Code、Cowork、OpenClaw 和 Codex 改变了资源使用方式,但代理消耗 token 速度远超预期。

OpenAI 上月突然关闭视频生成应用 Sora,放弃与迪士尼的 10 亿美元授权协议,原因是运行成本过高,算力需留给 Codex。Anthropic 上周也限制标准订阅用户使用 OpenClaw 代理框架,迫使他们转向按量付费计划。

看英文原文 →

MegaTrain 是一个以内存为中心的系统,利用主机内存(CPU 内存)存储参数和优化器状态,将 GPU 视为瞬态计算引擎。它通过流水线双缓冲执行引擎重叠参数预取、计算和梯度卸载,并使用无状态层模板替代持久化自动求导图,消除图元数据。

在单块 H200 GPU 搭配 1.5TB 主机内存上,MegaTrain 可稳定训练高达 120B 参数的模型。训练 14B 模型时,吞吐量达到 DeepSpeed ZeRO-3 的 1.84 倍;在单块 GH200 上,还能以 512k token 上下文训练 7B 模型。

看英文原文 →

从 12 条资讯中筛选

今日全部信源

这一期是从下面这些一手英文信源里,筛掉噪音后留下的。

明天这一封,也别错过。

每天一封,5 分钟读完。免费,随时退订。

去订阅 →