硅谷科技巨头多年来一直宣传AI智能体愿景,但现有技术仍然有限。强化学习环境被视为训练AI智能体的关键技术突破。这些环境模拟真实工作场景,让智能体学习复杂任务。顶级AI实验室正大量需求此类环境,催生了Mechanize、Prime Intellect等初创公司。数据标注巨头Scale AI、Surge也在转型。据报道,Anthropic考虑明年投资超10亿美元。尽管前景看好,但专家对强化学习环境的可扩展性存在分歧。