谷歌最新的 Gemini AI 模型意味着你的未来机器人管家即使没有 Wi-Fi 也能正常工作

多年来,我们一直被承诺将拥有能够帮你叠衣服、切洋葱,甚至像我们最喜欢的古装剧中那样说出妙语连珠的机器人管家。但这些承诺从未提到一个问题——不小心拔掉路由器可能会让那个机械管家瘫痪。谷歌声称,其最新的 Gemini AI 模型解决了这个问题。

谷歌最新的 Gemini AI 模型意味着你的未来机器人管家即使没有 Wi-Fi 也能正常工作

谷歌 DeepMind 推出了新的 Gemini 机器人端侧AI模型,旨在让机器人在电力中断和偏远地区工作时保持安全。虽然它的性能不如标准的云端 Gemini 模型强大,但它的独立运行意味着会更加可靠和实用。

这一突破在于,这款AI是一种视觉-语言-行动(VLA)模型,能够环顾四周,理解所见内容,解析自然语言指令,并在无需联网查词或任务的情况下执行操作。在测试中,安装了该模型的机器人能在陌生物体和新环境中完成任务,而不需要通过谷歌搜索。

这看起来似乎不算什么大事,但世界上有许多地方互联网有限甚至根本无法访问。机器人在农村医院、灾区和地下隧道工作时,不能出现延迟。现在,这个模型不仅运行速度快,谷歌还称它具备惊人的学习和适应能力。开发者表示,他们只需通过大约 50 次示范就能教会这款AI新技能,这与目前用于机器人训练的一些程序相比几乎是瞬间完成的。

离线机器人 AI

这种学习和适应能力同样体现在机器人灵活的物理设计上。该模型最初是为谷歌自家的双臂 ALOHA 设备设计的,但后来已经证明它能够安装在更复杂的机器上运行,比如 Apptronik 公司的阿波罗人形机器人。

机器能快速学习并独立行动的想法显然会引发一些担忧,但谷歌坚称他们正采取谨慎态度。该模型在其物理设计和所执行的任务中都内置了安全保障措施。

目前你还买不到搭载该模型的机器人,但未来拥有这款模型或其后继版本的机器人却很容易想象。假设你在五年后买了一个机器人助理,你希望它能做一些日常事情:叠毛巾、准备饭菜、防止你的小宝宝把乐高积木往楼梯上扔。可是,你的另一个孩子想看看那个闪灯的盒子是怎么工作的,结果灯突然不闪了。幸运的是,你机器人里安装的这个模型依然能“看见”并理解那些乐高积木是什么,以及你正在让它捡起积木放回桶里。

TechRadar的头像TechRadar认证作者

相关推荐

  • 苹果高层预告:M4 Mac新品发表将于下周一举行

    Apple行销副总裁Greg Joswiak透过社交媒体预告,Apple将在10月28日(周一)早上展开一连串重要发表。这波新品主要聚焦在Mac产品线,预计将发表搭载M4晶片的新款Mac。 消息指出,这次发表会将带来iMac、MacBook Pro和Mac mini等新品。这些新款Mac都将使用M4晶片,这款处理器已在今年5月发表的iPad Pro首度亮相。…

    2024年10月25日
    428
  • 英伟达RTX 5090:规格、价格与发布日期

    消费者对英伟达GeForce RTX 5090的期待值很高,因为大家预期这款显卡将打破记录,而我们终于迎来了它的揭晓。以下是关于这款即将发布的显卡的所有已知信息,包括价格、规格和发布日期。 英伟达GeForce RTX 4090一度是市场上最快的消费级显卡,因此它的继任者面临着巨大的挑战。RTX 5090作为RTX 4090的备受期待的后续产品,消费者可以根…

    2025年1月29日
    328
  • 现代智能手机设计无聊吗?我们询问了1500人,结果令人震惊

    不久前,我们的最佳手机指南展示了各种形状和大小的手机,从类似平板的三星Galaxy Note到色彩鲜艳的iPhone 5C。 然而,如今,平坦的金属侧边、轻微弯曲的角落和低调的工业色彩成为了主流,实用性和简约风格似乎比“看看我的新手机!”的个性更受重视。 但这种同质化现象真的不好吗?尽管如今的手机外观朴素,今天最好的(以及最畅销的)手机在客观上是比其更具个性…

    2025年4月4日
    214
  • 测试显示,ChatGPT-5 的幻觉率低于 GPT-4o —— 而 Grok 依然是“胡编乱造之王”

    上周四,OpenAI 推出了 ChatGPT-5,CEO Sam Altman 在发布会上重点强调,这一代是“我们有史以来推出的最强大、最智能、最快速、最可靠、最稳健的 ChatGPT 版本”,同时 OpenAI 团队也表示,ChatGPT-5 将“缓解幻觉问题”。 在 AI 领域,当模型胡编乱造时,这种现象被称为“幻觉”(hallucination)。虽然…

    2025年8月11日
    8
  • Google 正在让你喜爱的 AI 播客主持人变身为多语言达人

    看起来你用 Google 的 NotebookLM 创建的 AI“播客主持人”最近玩了不少多邻国(Duolingo)。这些由 AI 生成的《音频概览》主持人现在已经能使用超过 50 种语言进行播报。《音频概览》是 NotebookLM 的一项功能,它可以将你提供的文档、视频、书籍等信息转化为由一对 AI 声音主持的音频节目。 现在,在生成音频之前,你可以在设…

    2025年4月30日
    150

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注