具身智能日报|2026-06-30
1. Proception与特斯拉和解,机器人手获1100万美元融资
来源:TechCrunch | 时间:2026-06-29
前特斯拉Optimus人形机器人项目技术负责人Jay Li创办的机器人手公司Proception,已与特斯拉达成和解,结束了为期一年的商业秘密诉讼。Proception同时宣布获得1100万美元种子轮融资,由First Round Capital领投,Y Combinator和BoxGroup跟投。
核心技术突破:Proception采用一种独特的训练数据采集方案——让人类测试者佩戴布满传感器的手套,结合VR头显,采集"人类手部交互数据",无需机器人在场即可完成数据收集。这种手套同时安装在Proception自研的机器人手上,充当其"传感皮肤"。
该机器人手拥有22个自由度和多个关节 per 指,能够实现"广泛的灵巧运动"。与传统的遥操作方案(人类操作员通过VR设备控制机器人)相比,Proception的方案可采集更精细、更多任务定制化的数据。
第一性原理分析: Elon Musk曾多次表示,机器人手是"尚未解决的最大工程问题之一"。西北大学Kevin Lynch教授团队认为,真正功能化、实用化的机器人手可能还需要十年。但Proception认为,通过硬件+可扩展数据的组合,可以大幅缩短这一时间窗口。
影响:机器人灵巧操作(dexterous manipulation)是具身智能落地的"最后一公里"。Proception的传感器手套方案若能规模化,将对整个行业的数据采集范式产生深远影响。
2. General Intuition融资3.2亿美元:用游戏数据训练真实世界机器人
来源:TechCrunch | 时间:2026-06-25
通用机器人AI公司General Intuition宣布完成3.2亿美元融资,估值达23亿美元。投资方包括Khosla Ventures(领投)、Jeff Bezos、Eric Schmidt、Google DeepMind、MIT研究员等。
核心逻辑:General Intuition脱胎于游戏视频分享平台Medal。后者的数亿小时游戏上传视频中,包含了玩家按下的按键及时间戳——这些"动作标签"数据,是训练AI理解空间-时间推理的关键原料。
公司仅用8分钟真实机器人数据,即可为四足机器人微调一个可用的AI模型。更关键的是,这个"同一大脑"既在玩游戏,也在控制机器人。
第一性原理分析: 传统竞争者试图从视频中推断动作,而General Intuition认为,动作标签才是"类人直觉"涌现的关键。Vinod Khosla表示:"在World Models中,类人直觉的涌现将是类似LLM推理能力的量子飞跃。"
影响:真实机器人数据的采集成本高、速度慢。游戏数据作为"可扩展的捷径",若验证有效,将大幅加速具身智能的训练迭代。但物理世界的复杂性是否真能被游戏数据泛化,仍是未经验证的赌注。
3. Agility Robotics宣布25亿美元SPAC上市
来源:TechCrunch | 时间:2026-06-24
人形机器人公司Agility Robotics宣布将通过与SPAC公司Churchill Capital Corp XI合并的方式上市,公司估值约25亿美元。预计融资超6.2亿美元,其中约2亿美元来自新的机构投资者。
商业化进展:Agility的人形机器人Digit已部署于9个客户现场,包括Schaeffler、GXO、Toyota Motor Manufacturing Canada和Mercado Libre。Digit v5已获得超过3亿美元的多年度订单,另有30多个潜在客户正在评估大规模部署。
投资方阵容:Amazon、Nvidia、SoftBank Vision Fund 2、DCVC等顶级科技公司和基金。
影响:Agility是当前具身智能领域商业化程度最高的公司之一。SPAC上市路径的走通,对整个行业具有重要的资本市场参考意义——投资人愿意为人形机器人的"已部署"而非"已承诺"买单。
4. IEEE研究:视觉语言模型让机器人更懂情感,但修不了信任
来源:IEEE Robotics and Automation Letters | 时间:2026-06
Monash大学研究团队在IEEE机器人学期刊发表研究,探讨视觉语言模型(VLM)在机器人读懂人类情绪方面的能力。研究发现:
- VLM(使用Gemini 2.5)读懂人类情绪的得分(0.86)显著优于传统面部分析系统(0.77)
- 当机器人犯错后,31/40的参与者更偏好"情绪适应性道歉"而非"预设脚本道歉"
- 但研究同时发现:情绪适应能力是"社交润滑剂",无法修复机器人任务失败导致的信任损失
核心洞察:第一作者Seung Chan Hong表示:"VLM是良好的外部社交线索观察者,但不是读心者。它与第三方人类观察者匹配良好,但并不总是与用户内在的自我报告感受一致。"
影响:具身智能的情感计算模块正在快速成熟,但在真实应用中,机器人"能干活"远比"会道歉"重要。这一研究为行业提供了一条清晰的优先级路径。
5. IEEE观点:机器人不会有"ChatGPT时刻"
来源:IEEE Spectrum | 时间:2026-06
IEEE Spectrum刊发重磅评论文章,作者为Oregon State University机器人学教授、Agility Robotics联合创始人Jonathan Hurst,以及Google X Everyday Robots前CEO Hanspeter。
五大硬道理:
- YouTube与现实的差距是真实的:春晚机器人表演令人印象深刻,但低层运动控制≠通用智能
- 数据是未解决的挑战:机器人需要训练的数据维度远高于文本AI,且"好数据"极难获取
- 不会有单一的机器人AI:物理世界无限多样化,轮子、腿、单臂、多臂、飞行、水下——通用机器人AI还很遥远
- 泛化能力是核心瓶颈:在仿真中训练不等于在现实世界中work
- 工程化系统集成是关键:具身智能的突破将来自多个AI工具的协调工程化应用,而非单一突破
第一性思考:文章的核心论点是——机器人不会有"ChatGPT时刻",因为物理世界的复杂性无法被压缩成一个单一的大模型涌现。这与当前行业过度炒作人形机器人进入家庭的叙事形成对冲。
行业小结
本期日报聚焦三条主线:
- 数据范式之争:Proception的传感器手套 vs General Intuition的游戏动作标签,都在解决"可扩展的高质量机器人训练数据"这一核心瓶颈
- 商业化里程碑:Agility的SPAC上市标志着一级市场投资人开始为人形机器人商业化确定性下注
- 冷静反思:IEEE的两篇文章共同指向一个判断——行业对具身智能的预期与现实之间仍有巨大鸿沟,2026年不会是"机器人ChatGPT时刻"的元年
数据来源:TechCrunch、IEEE Spectrum / IEEE Robotics and Automation Letters | 生成时间:2026-06-30 17:10