Google 今日推出 Gemini 3.5 系列模型,首发型号 3.5 Flash。该模型专为执行复杂的智能体工作流而设计,在智能体和编码任务上达到前沿性能,尤其在需要长期规划的真实世界任务中表现出色。
3.5 Flash 在多项基准测试中超越 Gemini 3.1 Pro,例如 Terminal-Bench 2.1 得分 76.2%,GDPval-AA 达到 1656 Elo,MCP Atlas 得分 83.6%,多模态理解 CharXiv Reasoning 得分 84.2%。其输出速度是其他前沿模型的 4 倍,在 Artificial Analysis 指数中位于右上象限,兼顾质量与延迟。
看英文原文 →