谷歌新型AI模型能控制机器人折纸 (来源:网易科技报道)
3月13日消息,美国时间周三,Google旗下DeepMind实验室宣布推出两款用于控制 机器人 的全新 人工智能 模型:Gemini Robotics 与Gemini Robotics-ER。公司声称,这些模型能为多种形态的机器人赋予精细运动技能与环境适应能力,显著提升其在物理世界中的交互效率,推动 人形 机器人助手等应用落地。
值得注意的是,尽管用于机器人平台的硬件在稳步发展(尽管并非总是如此),如何确保人工智能系统能够安全精准控制机器人应对未知场景始终是行业难题。业内所谓的“具身智能”不仅是英伟达等科技巨头的“登月计划”,更是开启通用机器人劳工时代的关键钥匙。
谷歌 开发的新模型基于Gemini 2.0大语言模型,针对机器人应用特别增加了相关功能。其中Gemini Robotics整合了谷歌所称的“视觉-语言-行动”(Vision-Language-Action, VLA)能力,可处理视觉信息、理解语言指令并生成物理动作指令。而Gemini Robotics-ER则侧重于“具身推理”,提升空间认知能力,可无缝接入现有的机器人控制系统。
比如,Gemini Robotics可以命令机器人“将香蕉放进篮子”,其会利用摄像头获取场景图像识别香蕉,进而控制机械臂成功完成动作;也可以命令机器人“折纸狐狸”,系统则会运用如何精细折叠纸张的知识完成任务。
2023年,谷歌开发的RT-2模型在迈向通用机器人能力的道路上迈出重要一步——通过利用互联网数据帮助机器人理解语言指令并适应新场景,其在未知任务中的表现较前代模型翻倍。两年后,Gemini Robotics看似又取得了重大进展,不仅在理解指令方面表现出色,还能执行RT-2无法应对的复杂物理操作。
RT-2只能复现训练过的物理动作,但Gemini Robotics的灵活性实现了质的飞跃,能够完成折纸、零食封装等高难度任务。从仅仅理解指令的机器人,到能够执行精细物理任务的机器人,这一转变表明DeepMind正在逐步解决机器人领域最大挑战:如何让机器人将人工智能认知转化为现实世界中的精准动作。
泛化能力大幅提升
DeepMind表示,新推出的Gemini Robotics系统展现出更强的泛化性——即执行未经专门训练的新任务的能力,其表现远超此前的AI模型。公司称,Gemini Robotics在全面泛化基准测试中的表现“较同类最优模型性能提升超过两倍”。这种泛化能力至关重要,意味着机器人未来可无需针对每个场景专门训练即可适应新情境,甚至能在不可预测的真实世界环境中运行。
这点尤其重要,因为目前人们对人形机器人的实用性和能力仍有疑虑。去年10月份,特斯拉高调演示Optimus Gen 3人形机器人,宣称能完成多项物理任务,但有几台机器人被证实是由人工远程操控的,这使得人们对特斯拉自主人工智能的实际能力表示担忧。
谷歌则试图打造真正的“通用型机器大脑”。为此,谷歌宣布与总部位于得克萨斯州奥斯汀的Apptronik合作,基于Gemini 2.0构建下一代人形机器人。尽管这一模型主要在双机械臂平台ALOHA 2上进行训练,但谷歌表示,Gemini Robotics可用于控制不同类型的机器人,其中包括Franka机械臂以及类似于Apptronik Apollo人形机器人等更复杂的系统。
虽然人形机器人这一应用对于谷歌基于大语言模型的生成式人工智能来说较为新颖,但值得玩味的是,谷歌早在2013至2014年间就曾收购过几家机器人公司,其中还有打造出知名人形机器人的波士顿动力(Boston Dynamics,现属于现代集团),不过后来又悉数出售。此次与Apptronik开展的新合作,似乎是谷歌在探索人形机器人领域的新尝试,而非此前战略的延续。
其他公司也在紧锣密鼓地研发人形机器人硬件,比如Figure AI在2024年3月份为自家人形机器人筹得大额融资,前Alphabet子公司波士顿动力则在去年4月份推出一款灵活的新型Atlas机器人。但迄今为止,业界尚未出现真正能使机器人实用化的人工智能控制系统。谷歌还宣布,通过“可信测试者”计划向波士顿动力、Agility Robotics 和 Enchanted Tools等公司有限开放Gemini Robotics-ER的使用权限。
安全性与局限性
在安全性方面,谷歌提到采用“多层次、整体性的策略”,保留防碰撞和力度限制等机器人传统安全机制。公司还受阿西莫夫“机器人三定律”的启发,推出“机器人宪法”框架,并在此基础上发布了ASIMOV安全数据集,帮助研究人员评估机器人行为的安全性影响。
全新的ASIMOV数据集表明谷歌希望通过标准化方法来评估机器人安全性,不仅仅局限于防止物理伤害。这一数据集旨在帮助研究人员测试人工智能模型对机器人在不同场景中行为后果的认知能力。根据谷歌公告,ASIMOV数据集将“帮助研究人员在真实世界场景中严谨衡量机器人行动的安全性影响。”
谷歌并未宣布新模型的可用性时间表或商业应用层面的具体计划,目前这些模型仍处于研究阶段。尽管谷歌发布的演示视频展示了人工智能的惊人进步,但在控制环境下的实验仍然难以完全反映这些系统在现实世界中的真实表现。(辰辰)
小樱被❌🐻黄漫扒衣服 | 9天前 |
eva明日香❌羞羞 |
貂蝉被暴❌爽流白 | 6天前 |
男生隐私㊙️撒尿偷拍 |
男生把小🐥🐥寒进女生的🍑 | 0天前 |
火影小南被爆❌AV漫画CNMO |
芙宁娜裸体被❌羞羞 | 8天前 |
恋与深空涩涩同人❌18禁 |
免费➕无码➕国产65在线软件 | 5天前 |
直播探险18🔞 |
国产精品㊙️视频入口a114v | 5天前 |
纲手女裸乳被爆❌白浆的动漫 |
美女18隐私❌视频网站动漫 | 9天前 |
91❤️精彩刺激对白 |
灰原哀被❌18禁同人漫 | 2天前 |
扒开❌狂揉❌喷水视频动漫 |
火影同人被❌爆乳吸乳动漫 | 1天前 |
男生把🍌伸进男生🍑里无遮挡 |
扒开朱竹清❌狂揉❌难受粉红女郎 | 8天前 |
男生的隐私㊙️无内裤 |