新闻资讯-歌剧话剧

谷歌深度学习优化AI直接驱动机器人

发布时间:2025-06-25 07:10:59  浏览量:14

Google DeepMind推出了Gemini Robotics AI模型的新设备版,旨在无需互联网连接即可运行。这款视觉-语言-动作模型(VLA)展现出灵巧的能力,能够帮助机器人完成多种物理任务,即使是未经过专门训练的任务。新模型体积小巧、高效,能够直接在机器人上运行,标志着机器人技术的显著进步。虽然混合模型仍然更强大,但设备版模型的有效性令人惊喜,特别适用于连接受限的环境和严格安全协议的公司。该模型可通过50至100个示范迅速适应新情况,并已成功适用于多种机器人类型。与此同时,Google还推出了软件开发工具包(SDK),供开发者评估和完善新模型,标志着在VLA领域的重要里程碑。

Google DeepMind正在推出其Gemini Robotics AI模型的创新设备版,旨在无需互联网连接即可运行。这个视觉-语言-动作模型(VLA)展现出灵巧的能力,类似于其在三月份发布的前一版本。Google强调,这个新模型体积小巧且高效,能够直接在机器人上运行,标志着机器人技术的显著进步。

旗舰Gemini Robotics模型旨在帮助机器人完成各种物理任务,即使是那些未经过专门训练的任务。这种能力使机器人能够概括其理解并对指令做出适当反应,同时执行需要精细运动技能的任务。Google DeepMind的机器人部门负责人Carolina Parada向The Verge解释,原始的Gemini Robotics模型采用混合方法,既可以在设备上运行,也可以在云端运行。然而,新的仅设备模型为用户提供了离线功能,其性能与旗舰版本非常接近。

根据Parada的说法,这个设备版模型能够立即执行多项任务,并能通过50到100个示范迅速适应新情况。最初在ALOHA机器人上训练,这个模型也成功地适用于包括Apptronik的人形Apollo机器人和双臂Franka FR3机器人在内的各种机器人类型。Parada指出,尽管混合模型仍然更强大,但设备版模型的有效性令人感到惊喜。它特别适用于连接受限的环境和具有严格安全协议的公司。与这个模型一起,Google还推出了一个软件开发工具包(SDK),供开发者评估和完善设备版模型,这标志着Google DeepMind在VLA领域的重要里程碑。

标签: 谷歌 gemini 机器人 深度学习 robotics
sitemap