Google 推出本地运行的 Gemini 机器人模型:AI 走进现实世界
2025年6月,Google DeepMind发布了一项令人振奋的技术突破——一款名为Gemini Robotics On-Device的新型语言模型。这款模型不仅能控制机器人完成复杂任务,而且可以在本地设备上运行,无需依赖云端或互联网连接。
*图源:Google / TechCrunch
🌟什么是 Gemini Robotics On-Device?
Gemini Robotics On-Device 是 Google 在 3 月发布的 Gemini Robotics 模型的本地化版本。它的核心能力包括:
- 🧠使用自然语言指令控制机器人行为
- 🛠️在本地设备上运行,无需联网
- 📊性能接近云端模型,在多个基准测试中表现优异
Google 表示,这款模型在设备端的表现优于其他同类模型,尽管并未具体列出对比对象。
🧪实际演示:机器人拉拉链、折衣服
在官方演示中,Google 展示了机器人使用该模型完成以下任务:
- 🎒 拉上背包拉链
- 👕 折叠衣物
- 🏭 在工业流水线上进行组装
这些机器人包括:
🧰开发者工具:Gemini Robotics SDK
Google 同时发布了配套的 Gemini Robotics SDK,开发者可以:
- 🎮在 MuJoCo 物理模拟器中训练机器人
- ⚡通过 50~100 个任务演示,快速适配新任务
- 🗣️使用自然语言微调模型行为
这大大降低了机器人开发的门槛,让更多开发者能参与到机器人智能化的浪潮中。
🌍行业趋势:机器人基础模型竞赛升温
Google 并非唯一玩家。以下是当前机器人 AI 模型领域的主要参与者:
🔮展望未来:机器人智能的"iPhone 时刻"?
Gemini Robotics On-Device 的发布,标志着机器人智能从"云端依赖"迈向"边缘自治"。这不仅意味着更高的响应速度和隐私保障,也为机器人在家庭、工厂、医疗等场景的广泛部署铺平了道路。
未来,我们或许会看到:
- 🏠家用机器人能理解并执行自然语言指令
- 🏭工业机器人无需联网即可完成复杂装配
- 🤖人形机器人在现实世界中自主学习与适应
Comments
Post a Comment