AI2发布开源MolmoAct 7B模型,具备三维空间推理能力,挑战英伟达和谷歌在物理AI领域的地位。该模型能让机器人理解物理世界、规划空间占用并执行动作,任务成功率达72.1%,超越谷歌、微软和英伟达的模型。与传统视觉-语言-动作模型不同,MolmoAct通过空间感知令牌实现真正的3D理解,可适应不同机器人形态。