新闻资讯-歌剧话剧

谷歌发布 Gemini 2.5 Flash 预览版

编译/前方智能

2025 年 4 月 17 日,谷歌宣布推出 Gemini 2.5 Flash 的早期预览版本,该模型通过 Gemini API 在 Google AI Studio 和 Vertex AI 上提供。作为 2.0 Flash 的升级版,Gemini 2.5 Flash 在保持速度和低成本的同时,显著提升了推理能力。

Gemini 2.5 Flash 的一个重要创新是其完全混合的推理模型架构,开发者可以选择开启或关闭模型的“思考”过程,并能设置“思考预算”,从而在质量、成本和延迟之间找到最佳平衡点。即使在关闭思考功能的情况下,该模型也能保持 2.0 Flash 的快速响应速度,并提升性能。

图源:谷歌

谷歌强调,Gemini 2.5 Flash 在成本和模型尺寸方面都具有优势。其引入的“思考预算”功能允许开发者精细控制模型在思考过程中使用的最大 token 数量。较高的预算能提升模型质量,但可能会增加成本和延迟;较低的预算则有助于降低成本和加快响应速度。模型本身也经过训练,能够根据任务的复杂性自动决定所需的思考量。

对于简单的查询,开发者可以将思考预算设置为 0,以实现最低的成本和延迟,同时仍能获得优于 2.0 Flash 的性能。开发者也可以通过 API 参数或 Google AI Studio 和 Vertex AI 中的滑块设置特定的 token 预算。2.5 Flash 的思考预算范围为 0 到 24576 个 token。

行业分析认为,Gemini 2.5 Flash 引入的“思考预算”机制,为企业和开发者提供了前所未有的灵活性,使其能够根据实际应用场景的需求,在模型性能和成本之间进行精细调整,这标志着生成式 AI 技术的商业化进入了一个新的阶段。

免责声明:

1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。

2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

标签: 谷歌 gemini studio vertex flash