谷歌深度学习优化AI直接驱动机器人

发布时间：2025-06-25 07:10:59 浏览量：157

Google DeepMind推出了Gemini Robotics AI模型的新设备版，旨在无需互联网连接即可运行。这款视觉-语言-动作模型（VLA）展现出灵巧的能力，能够帮助机器人完成多种物理任务，即使是未经过专门训练的任务。新模型体积小巧、高效，能够直接在机器人上运行，标志着机器人技术的显著进步。虽然混合模型仍然更强大，但设备版模型的有效性令人惊喜，特别适用于连接受限的环境和严格安全协议的公司。该模型可通过50至100个示范迅速适应新情况，并已成功适用于多种机器人类型。与此同时，Google还推出了软件开发工具包（SDK），供开发者评估和完善新模型，标志着在VLA领域的重要里程碑。

Google DeepMind正在推出其Gemini Robotics AI模型的创新设备版，旨在无需互联网连接即可运行。这个视觉-语言-动作模型（VLA）展现出灵巧的能力，类似于其在三月份发布的前一版本。Google强调，这个新模型体积小巧且高效，能够直接在机器人上运行，标志着机器人技术的显著进步。

旗舰Gemini Robotics模型旨在帮助机器人完成各种物理任务，即使是那些未经过专门训练的任务。这种能力使机器人能够概括其理解并对指令做出适当反应，同时执行需要精细运动技能的任务。Google DeepMind的机器人部门负责人Carolina Parada向The Verge解释，原始的Gemini Robotics模型采用混合方法，既可以在设备上运行，也可以在云端运行。然而，新的仅设备模型为用户提供了离线功能，其性能与旗舰版本非常接近。

根据Parada的说法，这个设备版模型能够立即执行多项任务，并能通过50到100个示范迅速适应新情况。最初在ALOHA机器人上训练，这个模型也成功地适用于包括Apptronik的人形Apollo机器人和双臂Franka FR3机器人在内的各种机器人类型。Parada指出，尽管混合模型仍然更强大，但设备版模型的有效性令人感到惊喜。它特别适用于连接受限的环境和具有严格安全协议的公司。与这个模型一起，Google还推出了一个软件开发工具包（SDK），供开发者评估和完善设备版模型，这标志着Google DeepMind在VLA领域的重要里程碑。

标签：谷歌 gemini 机器人深度学习 robotics

相关资讯更多>>
分析师：美国司法部拆分谷歌的提议正中命门但成功几率不大

10-10 19:41
强制谷歌交出私有AI模型数据？美政府要对谷歌进行重大拆分

10-10 19:42
谷歌Pixel 9 Pro XL手机被曝存在严重安全问题，非法获取用户信息

10-10 19:20
谷歌谴责美国司法部提出的“激进”分拆计划

10-10 18:43
谷歌的非法搜索垄断：行业反应、影响

10-10 18:43
面对AI作图的日渐流行，谷歌想让相册应用提示照片是否经过AI处理

10-10 18:27
美国司法部考虑拆分谷歌

10-10 17:49
什么是ASO评论管理：管理苹果和谷歌应用商店评论的指南

10-10 15:44