具身智能日报｜2026-06-30

1. Proception与特斯拉和解，机器人手获1100万美元融资

来源：TechCrunch | 时间：2026-06-29

前特斯拉Optimus人形机器人项目技术负责人Jay Li创办的机器人手公司Proception，已与特斯拉达成和解，结束了为期一年的商业秘密诉讼。Proception同时宣布获得1100万美元种子轮融资，由First Round Capital领投，Y Combinator和BoxGroup跟投。

核心技术突破：Proception采用一种独特的训练数据采集方案——让人类测试者佩戴布满传感器的手套，结合VR头显，采集"人类手部交互数据"，无需机器人在场即可完成数据收集。这种手套同时安装在Proception自研的机器人手上，充当其"传感皮肤"。

该机器人手拥有22个自由度和多个关节 per 指，能够实现"广泛的灵巧运动"。与传统的遥操作方案（人类操作员通过VR设备控制机器人）相比，Proception的方案可采集更精细、更多任务定制化的数据。

第一性原理分析： Elon Musk曾多次表示，机器人手是"尚未解决的最大工程问题之一"。西北大学Kevin Lynch教授团队认为，真正功能化、实用化的机器人手可能还需要十年。但Proception认为，通过硬件+可扩展数据的组合，可以大幅缩短这一时间窗口。

影响：机器人灵巧操作（dexterous manipulation）是具身智能落地的"最后一公里"。Proception的传感器手套方案若能规模化，将对整个行业的数据采集范式产生深远影响。

2. General Intuition融资3.2亿美元：用游戏数据训练真实世界机器人

来源：TechCrunch | 时间：2026-06-25

通用机器人AI公司General Intuition宣布完成3.2亿美元融资，估值达23亿美元。投资方包括Khosla Ventures（领投）、Jeff Bezos、Eric Schmidt、Google DeepMind、MIT研究员等。

核心逻辑：General Intuition脱胎于游戏视频分享平台Medal。后者的数亿小时游戏上传视频中，包含了玩家按下的按键及时间戳——这些"动作标签"数据，是训练AI理解空间-时间推理的关键原料。

公司仅用8分钟真实机器人数据，即可为四足机器人微调一个可用的AI模型。更关键的是，这个"同一大脑"既在玩游戏，也在控制机器人。

第一性原理分析：传统竞争者试图从视频中推断动作，而General Intuition认为，动作标签才是"类人直觉"涌现的关键。Vinod Khosla表示："在World Models中，类人直觉的涌现将是类似LLM推理能力的量子飞跃。"

影响：真实机器人数据的采集成本高、速度慢。游戏数据作为"可扩展的捷径"，若验证有效，将大幅加速具身智能的训练迭代。但物理世界的复杂性是否真能被游戏数据泛化，仍是未经验证的赌注。

3. Agility Robotics宣布25亿美元SPAC上市

来源：TechCrunch | 时间：2026-06-24

人形机器人公司Agility Robotics宣布将通过与SPAC公司Churchill Capital Corp XI合并的方式上市，公司估值约25亿美元。预计融资超6.2亿美元，其中约2亿美元来自新的机构投资者。

商业化进展：Agility的人形机器人Digit已部署于9个客户现场，包括Schaeffler、GXO、Toyota Motor Manufacturing Canada和Mercado Libre。Digit v5已获得超过3亿美元的多年度订单，另有30多个潜在客户正在评估大规模部署。

投资方阵容：Amazon、Nvidia、SoftBank Vision Fund 2、DCVC等顶级科技公司和基金。

影响：Agility是当前具身智能领域商业化程度最高的公司之一。SPAC上市路径的走通，对整个行业具有重要的资本市场参考意义——投资人愿意为人形机器人的"已部署"而非"已承诺"买单。

4. IEEE研究：视觉语言模型让机器人更懂情感，但修不了信任

来源：IEEE Robotics and Automation Letters | 时间：2026-06

Monash大学研究团队在IEEE机器人学期刊发表研究，探讨视觉语言模型（VLM）在机器人读懂人类情绪方面的能力。研究发现：

VLM（使用Gemini 2.5）读懂人类情绪的得分（0.86）显著优于传统面部分析系统（0.77）
当机器人犯错后，31/40的参与者更偏好"情绪适应性道歉"而非"预设脚本道歉"
但研究同时发现：情绪适应能力是"社交润滑剂"，无法修复机器人任务失败导致的信任损失

核心洞察：第一作者Seung Chan Hong表示："VLM是良好的外部社交线索观察者，但不是读心者。它与第三方人类观察者匹配良好，但并不总是与用户内在的自我报告感受一致。"

影响：具身智能的情感计算模块正在快速成熟，但在真实应用中，机器人"能干活"远比"会道歉"重要。这一研究为行业提供了一条清晰的优先级路径。

5. IEEE观点：机器人不会有"ChatGPT时刻"

来源：IEEE Spectrum | 时间：2026-06

IEEE Spectrum刊发重磅评论文章，作者为Oregon State University机器人学教授、Agility Robotics联合创始人Jonathan Hurst，以及Google X Everyday Robots前CEO Hanspeter。

五大硬道理：

YouTube与现实的差距是真实的：春晚机器人表演令人印象深刻，但低层运动控制≠通用智能
数据是未解决的挑战：机器人需要训练的数据维度远高于文本AI，且"好数据"极难获取
不会有单一的机器人AI：物理世界无限多样化，轮子、腿、单臂、多臂、飞行、水下——通用机器人AI还很遥远
泛化能力是核心瓶颈：在仿真中训练不等于在现实世界中work
工程化系统集成是关键：具身智能的突破将来自多个AI工具的协调工程化应用，而非单一突破

第一性思考：文章的核心论点是——机器人不会有"ChatGPT时刻"，因为物理世界的复杂性无法被压缩成一个单一的大模型涌现。这与当前行业过度炒作人形机器人进入家庭的叙事形成对冲。

行业小结

本期日报聚焦三条主线：

数据范式之争：Proception的传感器手套 vs General Intuition的游戏动作标签，都在解决"可扩展的高质量机器人训练数据"这一核心瓶颈
商业化里程碑：Agility的SPAC上市标志着一级市场投资人开始为人形机器人商业化确定性下注
冷静反思：IEEE的两篇文章共同指向一个判断——行业对具身智能的预期与现实之间仍有巨大鸿沟，2026年不会是"机器人ChatGPT时刻"的元年

数据来源：TechCrunch、IEEE Spectrum / IEEE Robotics and Automation Letters | 生成时间：2026-06-30 17:10

具身智能日报｜2026-06-30#

1. Proception与特斯拉和解，机器人手获1100万美元融资#

2. General Intuition融资3.2亿美元：用游戏数据训练真实世界机器人#

3. Agility Robotics宣布25亿美元SPAC上市#

4. IEEE研究：视觉语言模型让机器人更懂情感，但修不了信任#

5. IEEE观点：机器人不会有"ChatGPT时刻"#

行业小结#