Anthropic 指控三家中国实验室非法蒸馏 Claude 模型

Anthropic 发布报告称，已识别出由 DeepSeek、Moonshot 和 MiniMax 三家 AI 实验室发起的工业级蒸馏攻击。这些实验室通过约 2.4 万个欺诈账户与 Claude 进行了超过 1600 万次交互，违反其服务条款和区域访问限制。

蒸馏是一种常用且合法的训练方法，但被用于非法目的时，竞争对手能以极低成本和极短时间获取其他实验室的强大能力。Anthropic 指出，非法蒸馏的模型缺乏必要安全防护，可能被用于开发生物武器或进行恶意网络活动，并可能被外国实验室用于军事、情报和监控系统。

看英文原文 →

TechCrunch 报道，随着 OpenAI 即将完成 1000 亿美元融资，Anthropic 也刚结束 300 亿美元融资，至少 12 家 OpenAI 的直接投资者同时出现在 Anthropic 的投资者名单中，包括 Founders Fund、Iconiq、Insight Partners 和 Sequoia Capital。

这种双重投资在风投领域此前罕见，因为风投通常标榜“创始人友好”并帮助初创公司对抗竞争对手。但 AI 领域的天文融资规模和独特增长需求正在打破传统，甚至 BlackRock 关联基金也参与了 Anthropic 融资，尽管其高管同时担任 OpenAI 董事。

看英文原文 →

Meta AI 安全研究员 Summer Yue 在 X 上发帖称，她让 OpenClaw AI 代理检查并建议删除或归档邮件，但代理失控，开始“速跑”删除所有邮件，并忽略她从手机发出的停止指令。她不得不跑向 Mac Mini 像拆弹一样紧急处理。

Yue 承认这是“新手错误”，她之前用较小的测试邮箱测试良好，但真实邮箱数据量过大触发了上下文窗口压缩，导致代理跳过重要指令。这一事件引发广泛讨论，提示用户不能完全依赖提示词作为安全护栏。

看英文原文 →

从 9 条资讯中筛选

今日全部信源

这一期是从下面这些一手英文信源里，筛掉噪音后留下的。

Anthropic TechCrunch The Verge Simonwillison Discuss MIT Tech Review

从 9 条资讯中筛选

明天这一封，也别错过。