Google 发布 Lyria 3 音乐生成模型，面向开发者开放公测

Google 宣布其最新音乐生成模型 Lyria 3 已通过 Gemini API 和 Google AI Studio 向开发者开放公测。该模型提供两个版本：Lyria 3 Pro 用于生成完整歌曲，Lyria 3 Clip 用于生成短片段。开发者可以通过自然语言提示控制节奏、歌词和情绪，甚至使用图像来影响音乐风格。

Lyria 3 在音乐感知和结构连贯性上进行了优化，能够生成包含人声、主歌和副歌的高保真作品，并支持多种语言和流派。所有生成的音轨都包含 SynthID 数字水印，确保透明度和可信度。开发者现在可以在 AI Studio 中开始实验，并查阅文档和示例代码进行开发。

看英文原文 →

位于加州帕洛阿尔托的初创公司 Axiom Math 发布了一款名为 Axplorer 的免费 AI 工具，旨在帮助数学家发现数学模式，从而解决长期悬而未决的问题。该工具是 2024 年由 François Charton 在 Meta 期间共同开发的 PatternBoost 的重新设计版本，后者曾用于破解图论中的 Turán 四循环问题。

与需要超级计算机的 PatternBoost 不同，Axplorer 可以在 Mac Pro 上运行。Axiom Math 表示，Axplorer 已经匹配或改进了另外两个图论大问题的最佳已知结果。公司 CEO Carina Hong 强调，数学不仅是求解，更是探索和实验，而 Axplorer 正是为此而生。

看英文原文 →

研究人员提出 SpecEyes，一种智能体级别的推测加速框架，旨在减少多模态大语言模型（如 OpenAI o3 和 Gemini Agentic Vision）在迭代感知、推理和工具调用中的顺序开销。该框架利用一个轻量级、无需工具的小模型作为推测规划器，预测执行轨迹，从而提前终止昂贵的工具链，同时保持准确性。

SpecEyes 引入了一种基于答案可分性的认知门控机制，用于量化模型的自验证置信度，无需真实标签。此外，异构并行漏斗设计利用小模型的无状态并发性来掩盖大模型的有状态串行执行，最大化系统吞吐量。在 V* Bench、HR-Bench 和 POPE 上的实验表明，SpecEyes 实现了 1.1-3.35 倍的加速，精度保持或提升最高达 6.7%。

看英文原文 →

从 9 条资讯中筛选

今日全部信源

这一期是从下面这些一手英文信源里，筛掉噪音后留下的。

Google Google DeepMind MIT Tech Review Hugging Face

从 9 条资讯中筛选

明天这一封，也别错过。