Anthropic 宣布启动 Project Glasswing,旨在利用其未发布的通用前沿模型 Claude Mythos 2 Preview 来加强网络安全。该模型在寻找和利用软件漏洞方面已超越除最顶尖人类之外的所有人,并在所有主流操作系统和网页浏览器中发现了数千个高危漏洞。
作为项目的一部分,Anthropic 将与多家合作伙伴共享模型访问权限,并承诺投入高达 1 亿美元的 Mythos Preview 使用额度,以及 400 万美元直接捐赠给开源安全组织。Anthropic 表示,AI 能力的快速进步可能很快导致这些能力被滥用,因此需要立即采取行动进行防御。
看英文原文 →