加州欧文的FieldAI公司宣布获得4.05亿美元融资,用于开发"基础具身AI模型"——通用机器人大脑,帮助人形机器人、四足机器人和自动驾驶汽车适应新环境。最新一轮融资3.14亿美元由贝索斯探险基金等共同领投。该公司构建基于物理学的"场基础模型",通过在AI模型中加入物理层,让机器人能够安全学习并适应新环境,同时具备风险意识和安全决策能力。
西雅图AI研究机构Ai2发布MolmoAct 7B,这是首个动作推理模型,能让机器人在执行任务前进行"思考"和规划。该模型可将自然语言指令转化为3D空间中的运动轨迹,通过1800万样本在256个H100芯片上训练完成。在SimPLER基准测试中达到72.1%的任务成功率,超越了谷歌、微软等公司的同类模型。
2009年,比尔·戴利加入英伟达研究实验室时,该实验室仅有约12名员工,专注于计算机图形学中的光线追踪技术。如今这个实验室已发展至400多人,帮助英伟达从90年代的游戏GPU初创公司转型为价值4万亿美元的AI巨头。目前实验室重点开发机器人和AI技术,部分研究成果已应用于产品中。英伟达在周一发布了面向机器人开发者的新AI模型、库和基础设施,展现了从物理AI到机器人领域的技术进展。
英伟达在SIGGRAPH大会上发布了全新的AI世界模型、库和机器人开发基础设施。其中最引人注目的是Cosmos Reason,这是一个70亿参数的"推理"视觉语言模型,专门用于物理AI应用和机器人。新发布的还包括Cosmos Transfer-2模型,能够从3D仿真场景加速合成数据生成,以及速度优化版本。公司还推出了神经重建库、RTX Pro Blackwell服务器和DGX Cloud云平台,旨在为机器人开发提供完整的解决方案。
随着AI引发投资热潮,每月都有更多初创企业获得独角兽地位。TechCrunch追踪了今年迄今为止成为独角兽的风投支持初创企业。虽然大多数与AI相关,但令人意外的是许多企业专注于其他行业,如卫星公司Loft Orbital和区块链交易网站Kalshi。这些价值超过10亿美元的初创企业涵盖软件开发、机器人技术、医疗健康等多个领域。
亚马逊机器人部门宣布已部署超过一百万台仓储机器人,并推出DeepFleet人工智能系统。该系统如交通控制器般协调机器人运行,提高移动效率并避免拥堵。从2012年开始测试至今,这些机器人已成为亚马逊履行中心的主力,遍布300多个仓库。DeepFleet基于AWS构建,能实时重新规划机器人路径,将行进时间缩短约10%。亚马逊表示机器人创造了更多技术岗位而非取代人工。
新的数字秩序正在形成,人工智能正从工具扩展为完整系统。AI驱动的机器人技术从新奇概念转向基础设施,可编程资本从投机转向现实经济层面。亚马逊仓库中机器人数量几乎超过人类,显示AI机器人已在改变物流业。专家预测,未来将出现1500美元以下的单一功能机器人,如洗衣、烹饪、割草等。稳定币正获得发展势头,有望重塑全球金融系统。Meta高薪挖角OpenAI研究员,AI军备竞赛愈演愈烈。
全球物理人工智能研究实验室Genesis AI宣布成立并获得1.05亿美元融资,由Eclipse和Khosla Ventures共同领投。该公司致力于开发智能机器人AI模型,采用数据驱动的全栈物理AI方法,构建可扩展的通用数据引擎进行物理模拟和大规模机器人数据收集。Genesis旨在打造能够为不同类型机器人提供人类级别智能的通用机器人基础模型平台,解决当前机器人在灵活性、认知能力和实际推理方面的局限性。
2025年上半年见证了AI领域的重大突破。Meta投资143亿美元成立超级智能实验室,微软声称其AI诊断准确率比医生高4倍。四大AI力量正在重塑社会:计算成本下降25倍但GPU供应仍然紧张;合成数据市场预计2030年达37亿美元;50个主要模型发布打破算法极限;特斯拉等公司准备在2025年末商业化人形机器人。这些力量相互放大,为准备充分的企业创造机遇,给未准备者带来威胁。
谷歌DeepMind发布新的离线视觉语言行动模型,让机器人无需云端支持即可自主运行。该模型基于Gemini的多模态理解能力,能够完成系鞋带、折衣服等复杂任务。相比之前的混合云端模式,新模型准确性仅略有下降,但大幅提升了响应速度和隐私保护。开发者可通过SDK进行定制化调优,仅需50-100次演示即可适应新任务。
Warp成立于2021年,致力于通过技术赋能的物流网络优化企业供应链。该公司现计划使用机器人自动化其仓储网络,进一步提升供应链效率。公司在洛杉矶测试仓库安装摄像头,利用计算机视觉技术创建数字孪生环境进行实验。经过测试,Warp成功部署改装后的现成机器人处理货物装卸和存储。公司刚完成1000万美元A轮融资,计划今年开始在核心网络城市部署机器人技术。
亚马逊推出具“感知”能力的 Vulcan 机器人,通过取代部分仓储作业并培训机器人技术员,推动员工技能转型,开启机器人与人协作的新局面。
本文讨论了新材料、AI与机器学习推动下的人形机器人技术突破传统工业自动化,迈向智能化、灵活性更强的未来,并预测于2025年实现量产,可能重塑社会经济结构。
科技巨头和初创公司正在开发人形机器人,利用先进AI模型赋能机器人可以执行家务和物流工作,但仍面临诸多技术和信任挑战。
英伟达宣布与迪士尼研究院和谷歌 DeepMind 合作开发 Newton 物理引擎,用于模拟真实环境中的机器人动作。迪士尼将率先使用 Newton 驱动其下一代娱乐机器人,如星球大战风格的 BDX 机器人。英伟达计划于 2025 年晚些时候发布 Newton 的早期开源版本。这项合作将为迪士尼主题公园带来更具表现力和精确性的机器人体验。
谷歌公司今天推出了两款新型人工智能模型,Gemini Robotics和Gemini Robotics-ER,旨在为自主机器提供动力。这些算法基于该公司Gemini 2.0系列的大型语言模型,能够处理文本和视频等多模态数据,使得新模型能够在决策时分析机器人摄像头拍摄的画面。
SXSW 2025年会在奥斯汀拉开帷幕,AI成为本届大会的核心主题。从创作者经济到深科技,从气候可持续发展到自动驾驶,各领域的前沿技术将集中展示。TechCrunch将深入报道,捕捉科技生态系统的最新动向,探讨AI如何应用于现实世界,并关注行业领袖的观点。
Figure 公司宣布将于 2025 年底开始在家庭环境中进行 Figure 02 人形机器人的"Alpha 测试"。这一加速计划得益于公司自主研发的 Helix 视觉-语言-行动模型。尽管家庭环境复杂多变,但 Figure 仍决定优先发展家用机器人,以应对人口老龄化等社会问题。
Meta 计划开发人工智能、传感器和其他软件,作为机器人制造和销售平台的基础。该公司正与多家机器人公司洽谈合作,并认为此举将为其人工智能和混合现实项目带来价值。Meta 正组建新团队,由前 Cruise 首席执行官领导,专注于这一领域的研究和开发。
微软推出了新型AI模型Magma,旨在提升机器人的视觉、理解和行动能力。Magma能同时处理多种类型的数据,是朝着"代理AI"迈出的重要一步。该模型结合了视觉和语言处理技术,经过多模态训练,可以执行操控机器人和导航用户界面等任务,为AI自动化日常生活开辟了新的可能性。