Google 推出本地运行的 Gemini 机器人模型:AI 走进现实世界

2025年6月,Google DeepMind发布了一项令人振奋的技术突破——一款名为Gemini Robotics On-Device的新型语言模型。这款模型不仅能控制机器人完成复杂任务,而且可以在本地设备上运行,无需依赖云端或互联网连接。

*图源:Google / TechCrunch

🌟什么是 Gemini Robotics On-Device?

Gemini Robotics On-Device 是 Google 在 3 月发布的 Gemini Robotics 模型的本地化版本。它的核心能力包括:

  • 🧠使用自然语言指令控制机器人行为
  • 🛠️在本地设备上运行,无需联网
  • 📊性能接近云端模型,在多个基准测试中表现优异

Google 表示,这款模型在设备端的表现优于其他同类模型,尽管并未具体列出对比对象。


🧪实际演示:机器人拉拉链、折衣服

在官方演示中,Google 展示了机器人使用该模型完成以下任务:

  • 🎒 拉上背包拉链
  • 👕 折叠衣物
  • 🏭 在工业流水线上进行组装

这些机器人包括:

机器人名称类型应用示例
ALOHA单臂机器人初始训练平台
Franka FR3双臂机器人工业装配任务
Apptronik Apollo人形机器人多任务泛化控制

🧰开发者工具:Gemini Robotics SDK

Google 同时发布了配套的 Gemini Robotics SDK,开发者可以:

  • 🎮在 MuJoCo 物理模拟器中训练机器人
  • 通过 50~100 个任务演示,快速适配新任务
  • 🗣️使用自然语言微调模型行为

这大大降低了机器人开发的门槛,让更多开发者能参与到机器人智能化的浪潮中。


🌍行业趋势:机器人基础模型竞赛升温

Google 并非唯一玩家。以下是当前机器人 AI 模型领域的主要参与者:

公司/组织进展与方向
Nvidia构建类人机器人基础模型平台
Hugging Face开放机器人模型与数据集,积极研发机器人系统
RLWRLD(韩国)获 Mirae Asset 支持,开发机器人基础模型
Genesis AI获得 1.05 亿美元种子轮融资,专注合成数据训练

🔮展望未来:机器人智能的"iPhone 时刻"?

Gemini Robotics On-Device 的发布,标志着机器人智能从"云端依赖"迈向"边缘自治"。这不仅意味着更高的响应速度和隐私保障,也为机器人在家庭、工厂、医疗等场景的广泛部署铺平了道路。

未来,我们或许会看到:

  • 🏠家用机器人能理解并执行自然语言指令
  • 🏭工业机器人无需联网即可完成复杂装配
  • 🤖人形机器人在现实世界中自主学习与适应

Comments

Popular posts from this blog

AI 社会的诞生:从孤胆英雄到群体协作

历史性时刻:首位美国教宗利奥十四上任,人工智能与方济各传承成焦点