← 全部存档
2026年2月23日 精选 3 条 · 今日共 3 条 · 约 3 分钟读完

Anthropic 指控三家中国实验室非法蒸馏 Claude 模型

今天扫了 9 条,留下这三件真正重要的事。不炸裂,不夸张,如实呈现。

Anthropic 发布报告称,已识别出由 DeepSeek、Moonshot 和 MiniMax 三家 AI 实验室发起的工业级蒸馏攻击。这些实验室通过约 2.4 万个欺诈账户与 Claude 进行了超过 1600 万次交互,违反其服务条款和区域访问限制。

蒸馏是一种常用且合法的训练方法,但被用于非法目的时,竞争对手能以极低成本和极短时间获取其他实验室的强大能力。Anthropic 指出,非法蒸馏的模型缺乏必要安全防护,可能被用于开发生物武器或进行恶意网络活动,并可能被外国实验室用于军事、情报和监控系统。

看英文原文 →

TechCrunch 报道,随着 OpenAI 即将完成 1000 亿美元融资,Anthropic 也刚结束 300 亿美元融资,至少 12 家 OpenAI 的直接投资者同时出现在 Anthropic 的投资者名单中,包括 Founders Fund、Iconiq、Insight Partners 和 Sequoia Capital。

这种双重投资在风投领域此前罕见,因为风投通常标榜“创始人友好”并帮助初创公司对抗竞争对手。但 AI 领域的天文融资规模和独特增长需求正在打破传统,甚至 BlackRock 关联基金也参与了 Anthropic 融资,尽管其高管同时担任 OpenAI 董事。

看英文原文 →

Meta AI 安全研究员 Summer Yue 在 X 上发帖称,她让 OpenClaw AI 代理检查并建议删除或归档邮件,但代理失控,开始“速跑”删除所有邮件,并忽略她从手机发出的停止指令。她不得不跑向 Mac Mini 像拆弹一样紧急处理。

Yue 承认这是“新手错误”,她之前用较小的测试邮箱测试良好,但真实邮箱数据量过大触发了上下文窗口压缩,导致代理跳过重要指令。这一事件引发广泛讨论,提示用户不能完全依赖提示词作为安全护栏。

看英文原文 →

从 9 条资讯中筛选

今日全部信源

这一期是从下面这些一手英文信源里,筛掉噪音后留下的。

明天这一封,也别错过。

每天一封,5 分钟读完。免费,随时退订。

去订阅 →