谷歌发布 Gemini 2.5 Flash 预览版

编译/前方智能

2025 年 4 月 17 日，谷歌宣布推出 Gemini 2.5 Flash 的早期预览版本，该模型通过 Gemini API 在 Google AI Studio 和 Vertex AI 上提供。作为 2.0 Flash 的升级版，Gemini 2.5 Flash 在保持速度和低成本的同时，显著提升了推理能力。

Gemini 2.5 Flash 的一个重要创新是其完全混合的推理模型架构，开发者可以选择开启或关闭模型的“思考”过程，并能设置“思考预算”，从而在质量、成本和延迟之间找到最佳平衡点。即使在关闭思考功能的情况下，该模型也能保持 2.0 Flash 的快速响应速度，并提升性能。

图源：谷歌

谷歌强调，Gemini 2.5 Flash 在成本和模型尺寸方面都具有优势。其引入的“思考预算”功能允许开发者精细控制模型在思考过程中使用的最大 token 数量。较高的预算能提升模型质量，但可能会增加成本和延迟；较低的预算则有助于降低成本和加快响应速度。模型本身也经过训练，能够根据任务的复杂性自动决定所需的思考量。

对于简单的查询，开发者可以将思考预算设置为 0，以实现最低的成本和延迟，同时仍能获得优于 2.0 Flash 的性能。开发者也可以通过 API 参数或 Google AI Studio 和 Vertex AI 中的滑块设置特定的 token 预算。2.5 Flash 的思考预算范围为 0 到 24576 个 token。

行业分析认为，Gemini 2.5 Flash 引入的“思考预算”机制，为企业和开发者提供了前所未有的灵活性，使其能够根据实际应用场景的需求，在模型性能和成本之间进行精细调整，这标志着生成式 AI 技术的商业化进入了一个新的阶段。

免责声明：

1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。

2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

标签：谷歌 gemini studio vertex flash

相关资讯更多>>
分析师：美国司法部拆分谷歌的提议正中命门但成功几率不大

10-10 19:41
强制谷歌交出私有AI模型数据？美政府要对谷歌进行重大拆分

10-10 19:42
谷歌Pixel 9 Pro XL手机被曝存在严重安全问题，非法获取用户信息

10-10 19:20
谷歌谴责美国司法部提出的“激进”分拆计划

10-10 18:43
谷歌的非法搜索垄断：行业反应、影响

10-10 18:43
面对AI作图的日渐流行，谷歌想让相册应用提示照片是否经过AI处理

10-10 18:27
美国司法部考虑拆分谷歌

10-10 17:49
什么是ASO评论管理：管理苹果和谷歌应用商店评论的指南

10-10 15:44