尽管我们有时称Gemini和ChatGPT等聊天机器人为机器人★★✿ღ✿,但生成式AI正在真正的物理机器人中发挥越来越重要的作用★★✿ღ✿。继今年早些时候发布Gemini Robotics后★★✿ღ✿,谷歌DeepMind现在推出了一款新的设备端VLA(视觉语言动作)模型来控制机器人★★✿ღ✿。与之前的版本不同★★✿ღ✿,这个版本不依赖云端组件★★✿ღ✿,让机器人能够完全自主运行★★✿ღ✿。
谷歌DeepMind机器人部门负责人Carolina Parada表示★★✿ღ✿,这种AI机器人方法可以让机器人在复杂环境中更加可靠★★✿ღ✿。这也是谷歌机器人模型的首个版本★★✿ღ✿,开发者可以根据特定用途对其进行调优★★✿ღ✿。
机器人技术对AI来说是一个独特的挑战★★✿ღ✿,因为机器人不仅存在于物理世界中★★✿ღ✿,还会改变其环境★★✿ღ✿。无论是让机器人移动积木还是系鞋带★★✿ღ✿,都很难预测机器人可能遇到的每种情况★★✿ღ✿。传统的通过强化学习训练机器人动作的方法非常缓慢★★✿ღ✿,但生成式AI允许更大程度的泛化★★✿ღ✿。
它利用Gemini的多模态世界理解能力来完成全新的任务★★✿ღ✿,Carolina Parada解释道★★✿ღ✿。这使得Gemini不仅能够生成文本★★✿ღ✿、写诗★★✿ღ✿、总结文章★★✿ღ✿,还能编写代码★★✿ღ✿、生成图像★★✿ღ✿,同样也能生成机器人动作★★✿ღ✿。
在之前的Gemini Robotics版本中(这仍然是谷歌机器人技术的最佳版本)★★✿ღ✿,平台运行混合系统★★✿ღ✿,机器人上有一个小模型★★✿ღ✿,云端运行一个更大的模型★★✿ღ✿。你可能看过聊天机器人在生成输出时思考几秒钟★★✿ღ✿,但机器人需要快速反应★★✿ღ✿。如果你告诉机器人拾取并移动物体tokyo hot n0601★★✿ღ✿,你不希望它在生成每个步骤时暂停尊龙网站首页★★✿ღ✿,★★✿ღ✿。本地模型允许快速适应尊龙凯时(中国)人生就是博!★★✿ღ✿,而基于服务器的模型可以帮助处理复杂的推理任务tokyo hot n0601★★✿ღ✿。谷歌DeepMind现在将本地模型作为独立的VLA发布★★✿ღ✿,它的表现出人意料地强大★★✿ღ✿。
新的Gemini Robotics设备端模型的准确性仅略低于混合版本★★✿ღ✿。据Parada介绍tokyo hot n0601★★✿ღ✿,许多任务可以直接使用★★✿ღ✿。当我们与机器人互动时★★✿ღ✿,发现它们在理解新情况方面能力惊人★★✿ღ✿,Parada告诉Ars★★✿ღ✿。
通过发布带有完整SDK的模型★★✿ღ✿,团队希望开发者能为Gemini驱动的机器人提供新任务并展示新环境★★✿ღ✿,这可能会揭示模型标准调优无法处理的动作★★✿ღ✿。使用SDK★★✿ღ✿,机器人研究人员能够仅用50到100次演示就让VLA适应新任务tokyo hot n0601★★✿ღ✿。
在AI机器人技术中尊龙凯时(中国)人生就是博!尊龙官网中国官网入口★★✿ღ✿,★★✿ღ✿,演示与其他AI研究领域有所不同tokyo hot n0601★★✿ღ✿。Parada解释说尊龙凯时(中国)人生就是博!★★✿ღ✿,演示通常涉及远程操作机器人——手动控制机械设备完成任务来调优模型尊龙凯时(中国)人生就是博!★★✿ღ✿,使其能够自主处理该任务★★✿ღ✿。虽然合成数据是谷歌训练的一个要素★★✿ღ✿,但它不能替代真实数据★★✿ღ✿。我们仍然发现★★✿ღ✿,对于最复杂★★✿ღ✿、最精细的行为★★✿ღ✿,我们需要真实数据★★✿ღ✿,Parada说tokyo hot n0601★★✿ღ✿。但通过仿真可以做很多事情尊龙凯时★★✿ღ✿,★★✿ღ✿。
然而AG尊龍凱時★★✿ღ✿!★★✿ღ✿,这些高度复杂的行为可能超出了设备端VLA的能力范围★★✿ღ✿。它应该能够毫无问题地处理简单动作★★✿ღ✿,如系鞋带(这对AI机器人来说传统上是一项困难任务)或折叠衬衫★★✿ღ✿。但是★★✿ღ✿,如果你想让机器人为你制作三明治★★✿ღ✿,它可能需要更强大的模型来进行必要的多步推理★★✿ღ✿,将面包放在正确的位置★★✿ღ✿。
团队认为Gemini Robotics设备端版本非常适合云连接不稳定或不存在的环境★★✿ღ✿。在本地处理机器人的视觉数据对隐私保护也更有利★★✿ღ✿,例如在医疗环境中★★✿ღ✿。
无论是提供危险信息的聊天机器人还是像终结者一样的机器人★★✿ღ✿,AI系统的安全性始终是一个关注点★★✿ღ✿。我们都见过生成式AI聊天机器人和图像生成器在输出中产生虚假信息智能显示★★✿ღ✿。★★✿ღ✿,驱动Gemini Robotics的生成系统也不例外——模型不是每次都能做对★★✿ღ✿,但给模型一个带有冰冷金属抓手的物理实体让问题变得更加棘手★★✿ღ✿。
为确保机器人行为安全★★✿ღ✿,Gemini Robotics采用多层方法★★✿ღ✿。通过完整的Gemini Robotics★★✿ღ✿,你连接到一个能够推理什么是安全行为的模型★★✿ღ✿,Parada说★★✿ღ✿。然后让它与实际产生选项的VLA对话★★✿ღ✿,接着VLA调用低级控制器★★✿ღ✿,后者通常具有安全关键组件★★✿ღ✿,比如可以施加多大力量或手臂可以多快移动★★✿ღ✿。
重要的是★★✿ღ✿,新的设备端模型只是一个VLA★★✿ღ✿,所以开发者需要自己构建安全机制★★✿ღ✿。不过尊龙凯时人生就是搏★★✿ღ✿,谷歌建议他们复制Gemini团队的做法★★✿ღ✿。建议早期测试程序中的开发者将系统连接到标准的Gemini Live APItokyo hot n0601尊龙凯时(中国)人生就是博!★★✿ღ✿,其中包含安全层★★✿ღ✿。他们还应该实施低级控制器进行关键安全检查★★✿ღ✿。
任何有兴趣测试Gemini Robotics设备端版本的人都应申请加入谷歌的可信测试程序★★✿ღ✿。谷歌的Carolina Parada表示★★✿ღ✿,过去三年中机器人技术取得了许多突破★★✿ღ✿,这只是开始——当前发布的Gemini Robotics仍基于Gemini 2.0★★✿ღ✿。Parada指出AG·尊时凯龙(中国区)人生就是搏!★★✿ღ✿。★★✿ღ✿,Gemini Robotics团队通常比Gemini开发落后一个版本★★✿ღ✿,而Gemini 2.5被认为在聊天机器人功能方面有了巨大改进★★✿ღ✿。也许机器人也会如此★★✿ღ✿。
上一篇 : 凯时尊龙官网深度解析:AI系统建设引领行业技术|写作业错了就塞一个东西在下面|革
下一篇: 没有了
人生就是博(中国区)集团官方网站| http://www.88tag.com