在 OpenAI 为预期中的首次公开募股(IPO)提交 SEC 文件之际,独立记者 Ed Zitron 获得的经审计财务报表显示,这家公司收入增长迅速,但支出增长更快。据《金融时报》审阅的同一批文件,OpenAI 2025 年月收入到年底已接近 20 亿美元,表明全年收入持续增长。
据 Ed Zitron 获得的文件,OpenAI 报告的收入从 2024 年的 37 亿美元增至 2025 年的 130.7 亿美元。但研发支出从 2024 年的 78.1 亿美元飙升至 2025 年的 191.8 亿美元,其中 2025 年向微软支付的研发费用就达 105.9 亿美元。收入成本(产品生产与分发支出)从 26.5 亿美元增至 75 亿美元,销售与营销成本从 11.1 亿美元增至 57.3 亿美元。
总体而言,OpenAI 的日常运营亏损从 2024 年的 87.8 亿美元增至 2025 年的 209.2 亿美元。但作为收入百分比,运营亏损率从 2024 年的 237% 改善至 2025 年的 160%。公司向投资者表示希望到 2030 年实现盈利。
据 TechCrunch 报道,OpenAI 在公开上市前引入两位重量级人物:Google DeepMind AI 传奇 Noam Shazeer 和前特朗普白宫 AI 政策官员 Dean Ball。Shazeer 于周三宣布离开 Google,他自 2000 年起在该公司工作,期间曾离职联合创办 Character AI,两年前 Google 以 27 亿美元交易重新聘用他。
Shazeer 是 2017 年开创性论文《Attention Is All You Need》的合著者,该论文引入了 Transformer 架构,被视为现代生成式 AI 的基础。据 The Information 报道,Shazeer 在 Google 内部曾就跨性别身份和以色列-哈马斯战争发表意见,导致管理层删除其帖子。这些争议是否会随他来到 OpenAI 尚待观察。
Ball 于周四在 X 上宣布,将于 7 月 6 日加入 OpenAI,领导新团队“Strategic Futures”,直接向首席战略官 Jason Kwon 汇报。该团队将专注于“灾难性风险、递归自我改进、劳动力市场影响以及前沿实验室与政府(尤其是美国联邦政府)及社会之间的关系”。Ball 在博客中表示,团队将涵盖对外政策和内部治理,并指出“内部治理将比大多数人意识到的更关乎 AI 的未来”。
据《华尔街日报》报道,AI 推理公司 Baseten 接近完成一轮 15 亿美元融资,估值达 130 亿美元。仅五个月前,该公司刚宣布完成 3 亿美元 E 轮融资,估值 50 亿美元;而 E 轮距离 1.5 亿美元 D 轮仅九个月。
据《华尔街日报》消息,本轮融资采用分价格轮(split-priced round)结构:部分投资者以 130 亿美元估值进入,部分以 110 亿美元估值进入。该轮由 Spark Capital、Sands Capital、Altimeter Capital 和 Wellington Management 联合领投。
Baseten 成立于 2019 年,受益于 The Next Wave 所称的“推理淘金热”,风投大量涌入推理层公司。推理是指模型在用户提交提示后执行的操作。Baseten 通过将请求路由到最适合任务的模型(尤其是高效、低成本的开源替代方案)来快速处理推理并控制成本。
据知情人士透露,企业软件公司 Elastic 已同意以最高 8500 万美元收购 AI 初创公司 DeductiveAI,后者利用 AI 检测并修复软件中的漏洞。DeductiveAI 成立于 2023 年,去年 11 月结束隐身模式,宣布获得由 CRV 领投的 750 万美元种子轮融资,Databricks Ventures、Thomvest Ventures 和 PrimeSet 参投。据 PitchBook 数据,该轮融资对公司的估值为 3300 万美元。
DeductiveAI 运营于 AI 站点可靠性工程(AI SRE)这一快速增长领域。该收购反映了大型科技公司通过收购 AI 原生初创企业将智能体技术整合进现有产品线的趋势。据知情人士透露,DeductiveAI 的年经常性收入约 100 万美元,但增长落后于同领域的 Resolve AI。Elastic 和 Deductive 未回应多次置评请求。
看英文原文 →据 Bloomberg 报道,亚马逊云服务(AWS)正在洽谈向其他公司出售其自研 AI 芯片 Trainium,用于数据中心。亚马逊 AI 负责人 Peter DeSantis 向 Bloomberg 透露了这一消息,但未指明潜在买家。亚马逊 CEO Andy Jassy 在 4 月初的年度股东信中表示,如果芯片业务独立运营,年营收可达约 500 亿美元,并暗示未来可能向第三方出售芯片机架。
AWS 此前因多重原因未出售芯片,包括芯片带来的瀑布效应收入(除芯片使用费外,还有存储、安全等附加服务),以及当前产能已售罄——Jassy 称 Trainium 及下一代 Trainium4 的容量均被抢购一空。AWS 发言人 Doron Aronson 确认了出售可能性。此举将直接挑战英伟达在 AI 芯片领域的主导地位,尽管英伟达当前营收规模约 3260 亿美元。
看英文原文 →美国联邦能源监管委员会(FERC)周四要求六大电网运营商为数据中心等大型用电户的并网请求开辟快速通道。数据中心需承担并网费用,委员们一致批准该指令。FERC 还要求电网运营商考虑“替代输电技术”,为电网技术初创企业提供机会。运营商需在 30 天内提交备用发电容量报告,60 天内调整电价。
FERC 的指令并未解决发电容量短缺问题。截至 2023 年底,发电厂并网请求已超过现有电厂总容量。与此同时,数据中心用电需求预计到 2035 年将增长近三倍。能源部长 Chris Wright 曾敦促 FERC 处理该问题,称并网延迟威胁美国 AI 竞争力。此外,特朗普政府周三同意向风电开发商 Invenergy 支付 7.65 亿美元以取消多个海上风电租约,该公司将转而建设天然气和地热项目。
看英文原文 →Anthropic 加入碳去除联盟 Frontier,成为首家加入该联盟的 AI 初创公司。Frontier 获得新一轮 9.15 亿美元资金承诺,使总承诺额翻倍至 18 亿美元。Frontier 已签约近 7 亿美元用于 50 多个项目,去除 180 万吨碳。Anthropic 的加入是其首个气候相关交易,此前该公司尚未发布可持续发展报告,并曾表示支持“全盘”能源策略。
Frontier 由 Stripe、Google 和 Shopify 等科技公司创立,旨在帮助实现气候承诺。Frontier 表示未来将减少项目数量,聚焦最有潜力实现年去除十亿吨 CO2 的项目,新合同期限约 8 至 10 年。Frontier 发言人告诉 TechCrunch,任何新签约的碳去除公司必须“展示获得政府补贴/支持的路径”。Frontier 的合同将签至 2040 年,期望届时政府能接手主导。
看英文原文 →据 The Verge 获悉,Barret Zoph 在重返 OpenAI 仅五个月后再次离职。Zoph 于 1 月中旬回归,此前他曾担任 Thinking Machines Lab 的联合创始人兼 CTO,该公司由前 OpenAI CTO Mira Murati 创立。回归后不久,OpenAI 表示他将领导企业业务——这是公司关键角色,因为 OpenAI 近期承诺停止追逐所谓的“支线任务”,专注于企业和编码等主要收入来源,以筹备 IPO。
OpenAI 向 The Verge 证实 Zoph 将离职,但未说明原因。
看英文原文 →据 The Verge 报道,三名亚马逊软件工程师在本月早些时候的西雅图市议会听证会上就数据中心问题作证,援引了一项禁止因政治言论歧视的城市法律。如今,他们指控雇主违反该法律,对他们进行报复。6 月 10 日——听证会一周后,市议会通过数据中心暂停令的次日——Patrick Schloesser、Darius Irani 和 Liesl Wigand 被分别叫去与亚马逊“员工关系”部门开会。
人力资源代表告知员工公司正在调查他们,并暗示可能面临解雇。三名工程师认为这是对其政治言论的报复,违反了西雅图法律。
看英文原文 →据 The Verge 报道,Anthropic 本周大部分时间都在努力恢复其最新 AI 模型的在线访问。此前,特朗普政府突然命令该公司切断所有外国国民的访问权限,包括美国境内的用户和公司自身员工,迫使 Anthropic 封锁了所有人对 Fable 5 和 Mythos 5 的访问。
Anthropic 在其网站上发布声明称,政府援引“国家安全权力”来证明“出口管制”的合理性。The Verge 指出,这可能是美国出口管制首次被用于以这种方式控制 AI 模型的访问。特朗普政府尚未公开解释该命令的法律依据。
看英文原文 →据 AP News 报道,参议员 Bernie Sanders 公布了一项激进计划,旨在将数万亿美元从领先 AI 公司转移给公众。该计划将创建一只主权财富基金,资金来源于对最大 AI 公司股票一次性征收 50% 的税。任何年 AI 销售额达到 2 亿美元的公司都需缴税,新公司达到该收入水平后同样适用。
Sanders 估计该基金价值可达 7 万亿美元,每年可产生“数千亿美元”用于直接支付给美国人以及医疗、教育、住房等项目。他预计每个美国人每年可获得超过 1000 美元的 5% 年度分红。该立法摘要已提交给 AP News。
看英文原文 →总部位于迈阿密的AI初创公司Subquadratic上个月走出隐身模式,宣称解决了困扰大语言模型近十年的数学瓶颈。该公司表示,其开发的新型LLM名为SubQ,比市场上任何其他模型更快、更便宜且能耗更低,能一次性处理多达12倍的文本量,适用于分析数百份文档或整个代码库等数据密集型任务。Subquadratic还声称SubQ在编码等关键任务上基本匹配Google DeepMind、OpenAI和Anthropic最佳模型的性能。然而,最初该公司仅提供了少量自测分数作为证据,且尚未广泛开放SubQ供公众试用,因此其声明遭到广泛质疑。
一个月后,Subquadratic发布了更多信息,包括第三方公司Appen进行的独立测试结果。Appen的生成式AI研究总监Jeanine Sinanan-Singh表示结果令人兴奋,验证了其架构。Subquadratic联合创始人兼CTO Alex Whedon承认,当初未同步发布第三方基准测试引发了怀疑,未来将确保结果充分验证后再公布。联合创始人兼CEO Justin Dangel表示希望开启效率新时代,认为几年内不会再有人基于Transformer构建模型。SubQ的突破在于用稀疏注意力取代密集注意力,大幅削减计算量,但此前尝试均未成功,Subquadratic声称首次实现了与密集注意力模型性能匹敌的稀疏注意力LLM。
看英文原文 →arXiv上发布的一篇新论文提出了AgenticRei框架,旨在解决由大语言模型驱动的自主代理AI系统带来的安全、隐私和合规挑战。论文指出,这类代理能够调用工具、操作数据、安装软件并与跨组织边界的同级代理协调,因此不仅需要身份验证和访问控制,还必须受企业治理完整结构的约束,包括指定代理允许和禁止的行为、某些操作后的义务(如通知CISO)、义务豁免条件以及策略冲突时的优先级规则。
据arXiv摘要,现有策略引擎如XACML、Rego和Cedar仅覆盖许可/禁止子集,缺乏义务生命周期管理、元策略冲突解决、特定情况下的义务豁免以及领域类层次的本体推理。AgenticRei基于Rei框架使用道义策略语言,以OWL(Web本体语言)表达,并在LLM之外由高性能逻辑引擎在运行时评估。同一管道同时治理代理的工具调用和代理间消息。论文通过示例表明,道义策略能够捕获当前生产引擎大多无法表达的安全和隐私治理约束,且该方法与A2AS等行业标准框架自然兼容。
看英文原文 →一篇Hacker News上的文章指出,AI生成代码的能力已大幅提升,但工程纪律不应因此放松。作者回顾了2025年AI代码从被视为“垃圾”到“不错”的转变,认为Opus 4.5是转折点,但代理框架(如工具使用、函数调用、MCP)早在2025年中就已开始发展,并在年底达到通用可用性。作者强调,代码生成的经济学已被颠覆:代码从昂贵、耗时变得近乎免费和即时,从被珍视和精心维护变为可丢弃和可重新生成。
作者认为,软件工程的真正产品是团队对软件的共享理解,而代码只是缓存。随着AI生成代码变得容易,工程纪律反而更加重要,包括代码审查、沟通规范等。作者批评了部分读者误解其此前文章,认为他主张放弃代码审查直接推送劣质代码,明确表示并非如此。文章呼吁在AI加速变革的背景下,工程团队应保持适应性和纪律性,而不是放松标准。
看英文原文 →美国国防部官员自豪地描述了一种新捷径:使用生成式AI工具为国会撰写报告。五角大楼首席技术官Emil Michael在6月12日哈德逊研究所活动中强调,AI生成的国会报告是国防部采用生成式AI的关键示例。自2025年12月起,五角大楼通过其定制的GenAI.mil平台,向所有六个军种成员广泛提供AI工具,首先是Google Cloud的Gemini for Government。
Michael表示,加载所有文件后,AI能在五小时内起草一份原本需要200小时人员时间的国会报告。此外,国防部负责科学和技术基础的副助理部长Jacob Glassman在4月23日的Box联邦峰会上描述,他曾让一个人员短缺的团队使用GenAI.mil撰写一份国会授权报告,一周后团队声称这是“五年来写得最好的报告”。据DefenseScoop报道,Glassman未指明具体报告。
看英文原文 →中国实验室 Z.ai 发布 GLM-5.2,据独立评测机构 Artificial Analysis Intelligence Index v4.1,该模型以 51 分位居开源模型第一,超越 MiniMax-M3、DeepSeek V4 Pro 和 Kimi K2.6。模型采用混合专家架构,总参数 7530 亿,每 token 激活约 400 亿参数,支持 100 万 token 上下文窗口,采用 MIT 许可证,权重于 2026 年 6 月 16 日在 Hugging Face 公开。
GLM-5.2 引入创新架构 IndexShare,通过复用轻量索引器降低计算量,声称在 100 万 token 上下文下减少 2.9 倍 FLOPs。但运行门槛极高:完整 BF16 权重达 1.51 TB,本地运行仅 Mac Studio M3 Ultra(256GB 以上统一内存)能以 2 位量化实现 3-9 token/秒的生成速度。据 VentureBeat,Z.ai 声称该模型在多项长时编码基准上超越 GPT-5.5,但在 Code Arena WebDev 排行榜上位列第二,仅次于 Claude Fable 5。
看英文原文 →从 100 条资讯中筛选
今日全部信源这一期是从下面这些一手英文信源里,筛掉噪音后留下的。