人生就是博(中国区)集团官方网站_技術創新_尊龙凯时(中国)人生就是博!|tokyo hot n0601|谷歌发布离线机器人

　　尽管我们有时称Gemini和ChatGPT等聊天机器人为机器人★★✿ღ✿，但生成式AI正在真正的物理机器人中发挥越来越重要的作用★★✿ღ✿。继今年早些时候发布Gemini Robotics后★★✿ღ✿，谷歌DeepMind现在推出了一款新的设备端VLA（视觉语言动作）模型来控制机器人★★✿ღ✿。与之前的版本不同★★✿ღ✿，这个版本不依赖云端组件★★✿ღ✿，让机器人能够完全自主运行★★✿ღ✿。

　　谷歌DeepMind机器人部门负责人Carolina Parada表示★★✿ღ✿，这种AI机器人方法可以让机器人在复杂环境中更加可靠★★✿ღ✿。这也是谷歌机器人模型的首个版本★★✿ღ✿，开发者可以根据特定用途对其进行调优★★✿ღ✿。

　　机器人技术对AI来说是一个独特的挑战★★✿ღ✿，因为机器人不仅存在于物理世界中★★✿ღ✿，还会改变其环境★★✿ღ✿。无论是让机器人移动积木还是系鞋带★★✿ღ✿，都很难预测机器人可能遇到的每种情况★★✿ღ✿。传统的通过强化学习训练机器人动作的方法非常缓慢★★✿ღ✿，但生成式AI允许更大程度的泛化★★✿ღ✿。

　　它利用Gemini的多模态世界理解能力来完成全新的任务★★✿ღ✿，Carolina Parada解释道★★✿ღ✿。这使得Gemini不仅能够生成文本★★✿ღ✿、写诗★★✿ღ✿、总结文章★★✿ღ✿，还能编写代码★★✿ღ✿、生成图像★★✿ღ✿，同样也能生成机器人动作★★✿ღ✿。

　　在之前的Gemini Robotics版本中（这仍然是谷歌机器人技术的最佳版本）★★✿ღ✿，平台运行混合系统★★✿ღ✿，机器人上有一个小模型★★✿ღ✿，云端运行一个更大的模型★★✿ღ✿。你可能看过聊天机器人在生成输出时思考几秒钟★★✿ღ✿，但机器人需要快速反应★★✿ღ✿。如果你告诉机器人拾取并移动物体tokyo hot n0601★★✿ღ✿，你不希望它在生成每个步骤时暂停尊龙网站首页★★✿ღ✿，★★✿ღ✿。本地模型允许快速适应尊龙凯时(中国)人生就是博!★★✿ღ✿，而基于服务器的模型可以帮助处理复杂的推理任务tokyo hot n0601★★✿ღ✿。谷歌DeepMind现在将本地模型作为独立的VLA发布★★✿ღ✿，它的表现出人意料地强大★★✿ღ✿。

　　新的Gemini Robotics设备端模型的准确性仅略低于混合版本★★✿ღ✿。据Parada介绍tokyo hot n0601★★✿ღ✿，许多任务可以直接使用★★✿ღ✿。当我们与机器人互动时★★✿ღ✿，发现它们在理解新情况方面能力惊人★★✿ღ✿，Parada告诉Ars★★✿ღ✿。

　　通过发布带有完整SDK的模型★★✿ღ✿，团队希望开发者能为Gemini驱动的机器人提供新任务并展示新环境★★✿ღ✿，这可能会揭示模型标准调优无法处理的动作★★✿ღ✿。使用SDK★★✿ღ✿，机器人研究人员能够仅用50到100次演示就让VLA适应新任务tokyo hot n0601★★✿ღ✿。

　　在AI机器人技术中尊龙凯时(中国)人生就是博!尊龙官网中国官网入口★★✿ღ✿，★★✿ღ✿，演示与其他AI研究领域有所不同tokyo hot n0601★★✿ღ✿。Parada解释说尊龙凯时(中国)人生就是博!★★✿ღ✿，演示通常涉及远程操作机器人——手动控制机械设备完成任务来调优模型尊龙凯时(中国)人生就是博!★★✿ღ✿，使其能够自主处理该任务★★✿ღ✿。虽然合成数据是谷歌训练的一个要素★★✿ღ✿，但它不能替代真实数据★★✿ღ✿。我们仍然发现★★✿ღ✿，对于最复杂★★✿ღ✿、最精细的行为★★✿ღ✿，我们需要真实数据★★✿ღ✿，Parada说tokyo hot n0601★★✿ღ✿。但通过仿真可以做很多事情尊龙凯时★★✿ღ✿，★★✿ღ✿。

　　然而AG尊龍凱時★★✿ღ✿！★★✿ღ✿，这些高度复杂的行为可能超出了设备端VLA的能力范围★★✿ღ✿。它应该能够毫无问题地处理简单动作★★✿ღ✿，如系鞋带（这对AI机器人来说传统上是一项困难任务）或折叠衬衫★★✿ღ✿。但是★★✿ღ✿，如果你想让机器人为你制作三明治★★✿ღ✿，它可能需要更强大的模型来进行必要的多步推理★★✿ღ✿，将面包放在正确的位置★★✿ღ✿。

　　团队认为Gemini Robotics设备端版本非常适合云连接不稳定或不存在的环境★★✿ღ✿。在本地处理机器人的视觉数据对隐私保护也更有利★★✿ღ✿，例如在医疗环境中★★✿ღ✿。

　　无论是提供危险信息的聊天机器人还是像终结者一样的机器人★★✿ღ✿，AI系统的安全性始终是一个关注点★★✿ღ✿。我们都见过生成式AI聊天机器人和图像生成器在输出中产生虚假信息智能显示★★✿ღ✿。★★✿ღ✿，驱动Gemini Robotics的生成系统也不例外——模型不是每次都能做对★★✿ღ✿，但给模型一个带有冰冷金属抓手的物理实体让问题变得更加棘手★★✿ღ✿。

　　为确保机器人行为安全★★✿ღ✿，Gemini Robotics采用多层方法★★✿ღ✿。通过完整的Gemini Robotics★★✿ღ✿，你连接到一个能够推理什么是安全行为的模型★★✿ღ✿，Parada说★★✿ღ✿。然后让它与实际产生选项的VLA对话★★✿ღ✿，接着VLA调用低级控制器★★✿ღ✿，后者通常具有安全关键组件★★✿ღ✿，比如可以施加多大力量或手臂可以多快移动★★✿ღ✿。

　　重要的是★★✿ღ✿，新的设备端模型只是一个VLA★★✿ღ✿，所以开发者需要自己构建安全机制★★✿ღ✿。不过尊龙凯时人生就是搏★★✿ღ✿，谷歌建议他们复制Gemini团队的做法★★✿ღ✿。建议早期测试程序中的开发者将系统连接到标准的Gemini Live APItokyo hot n0601尊龙凯时(中国)人生就是博!★★✿ღ✿，其中包含安全层★★✿ღ✿。他们还应该实施低级控制器进行关键安全检查★★✿ღ✿。

　　任何有兴趣测试Gemini Robotics设备端版本的人都应申请加入谷歌的可信测试程序★★✿ღ✿。谷歌的Carolina Parada表示★★✿ღ✿，过去三年中机器人技术取得了许多突破★★✿ღ✿，这只是开始——当前发布的Gemini Robotics仍基于Gemini 2.0★★✿ღ✿。Parada指出AG·尊时凯龙(中国区)人生就是搏!★★✿ღ✿。★★✿ღ✿，Gemini Robotics团队通常比Gemini开发落后一个版本★★✿ღ✿，而Gemini 2.5被认为在聊天机器人功能方面有了巨大改进★★✿ღ✿。也许机器人也会如此★★✿ღ✿。

回到上一頁