Posts

Showing posts from July, 2025

Google 推出本地运行的 Gemini 机器人模型:AI 走进现实世界

2025年6月,Google DeepMind发布了一项令人振奋的技术突破——一款名为 Gemini Robotics On-Device 的新型语言模型。这款模型不仅能控制机器人完成复杂任务,而且可以在本地设备上运行,无需依赖云端或互联网连接。 *图源:Google / TechCrunch 🌟 什么是 Gemini Robotics On-Device? Gemini Robotics On-Device 是 Google 在 3 月发布的 Gemini Robotics 模型的本地化版本。它的核心能力包括: 🧠 使用自然语言指令控制机器人行为 🛠️ 在本地设备上运行,无需联网 📊 性能接近云端模型,在多个基准测试中表现优异 Google 表示,这款模型在设备端的表现优于其他同类模型,尽管并未具体列出对比对象。 🧪 实际演示:机器人拉拉链、折衣服 在官方演示中,Google 展示了机器人使用该模型完成以下任务: 🎒 拉上背包拉链 👕 折叠衣物 🏭 在工业流水线上进行组装 这些机器人包括: 机器人名称 类型 应用示例 ALOHA 单臂机器人 初始训练平台 Franka FR3 双臂机器人 工业装配任务 Apptronik Apollo 人形机器人 多任务泛化控制 🧰 开发者工具:Gemini Robotics SDK Google 同时发布了配套的  Gemini Robotics SDK ,开发者可以: 🎮 在 MuJoCo 物理模拟器中训练机器人 ⚡ 通过 50~100 个任务演示,快速适配新任务 🗣️ 使用自然语言微调模型行为 这大大降低了机器人开发的门槛,让更多开发者能参与到机器人智能化的浪潮中。 🌍 行业趋势:机器人基础模型竞赛升温 Google 并非唯一玩家。以下是当前机器人 AI 模型领域的主要参与者: 公司/组织 进展与方向 Nvidia 构建类人机器人基础模型平台 Hugging Face 开放机器人模型与数据集,积极研发机器人系统 RLWRLD(韩国) 获 Mirae Asset 支持,开发机器人基础模型 Genesis AI 获得 1.05 亿美元种子轮融资,专注合成数据训练 🔮 展望未来:机器人智能的"iPhone 时刻"? Gemini Robotics On-Device 的发布,标志着机器...