Anthropic 启动 Project Glasswing，用前沿 AI 模型防御网络安全

Anthropic 宣布启动 Project Glasswing，旨在利用其未发布的通用前沿模型 Claude Mythos 2 Preview 来加强网络安全。该模型在寻找和利用软件漏洞方面已超越除最顶尖人类之外的所有人，并在所有主流操作系统和网页浏览器中发现了数千个高危漏洞。

作为项目的一部分，Anthropic 将与多家合作伙伴共享模型访问权限，并承诺投入高达 1 亿美元的 Mythos Preview 使用额度，以及 400 万美元直接捐赠给开源安全组织。Anthropic 表示，AI 能力的快速进步可能很快导致这些能力被滥用，因此需要立即采取行动进行防御。

看英文原文 →

Anthropic 宣布与 Google 和 Broadcom 签署新协议，获得数吉瓦级的下一代 TPU 容量，预计从 2027 年开始上线。这笔交易是 Anthropic 迄今为止最大的计算承诺，旨在满足客户需求的指数级增长，其年化收入已从 2025 年底的约 90 亿美元增至超过 300 亿美元。

大部分新计算能力将位于美国，这扩展了 Anthropic 2025 年 11 月承诺的 500 亿美元美国计算基础设施投资。此外，Anthropic 还宣布与塔塔咨询服务公司（TCS）合作，为 5 万名员工提供 Claude，并共同为金融、医疗等受监管行业构建产品。

看英文原文 →

《纽约时报》与初创公司 Oumi 合作的分析显示，Google 的 AI Overviews 在 SimpleQA 基准测试中正确率为 90%，但仍有 10% 的回答错误。Oumi 在 Gemini 3 更新后重新测试，准确率从 85% 提升至 91%，但错误率仍意味着每天可能产生数千万条错误答案。

Google 发言人 Ned Adriance 反驳称 SimpleQA 包含错误信息，该测试不能反映用户实际搜索情况。分析还指出，AI Overviews 并非单一模式，且 AI 评估工具本身也可能产生幻觉，使得准确性评估更加复杂。

看英文原文 →

从 11 条资讯中筛选

今日全部信源

这一期是从下面这些一手英文信源里，筛掉噪音后留下的。

Anthropic Simonwillison Ars Technica Dornsife Showbiz411 The Verge Hugging Face Garymarcus

从 11 条资讯中筛选

明天这一封，也别错过。