Google 宣布 Gemini 3.1 Flash-Lite 以预览形式面向开发者开放,可通过 Google AI Studio 的 Gemini API 以及面向企业的 Vertex AI 使用。该模型定价为每百万输入 token 0.25 美元、每百万输出 token 1.50 美元,旨在以更低成本处理高吞吐量工作负载。
据 Google 介绍,Gemini 3.1 Flash-Lite 在速度上超越 2.5 Flash,首 token 响应时间快 2.5 倍,输出速度提升 45%。该模型在 Arena.ai 排行榜上获得 1432 的 Elo 评分,并在 GPQA Diamond 和 MMMU Pro 等基准测试中分别达到 86.9% 和 76.8%。此外,模型支持在 AI Studio 和 Vertex AI 中调节思考层级,适用于翻译、内容审核、用户界面生成和模拟等任务。
看英文原文 →