掩码逆向强化学习 关键字列表
Masked IRL:大语言模型助力机器人理解模糊指令

Masked IRL:大语言模型助力机器人理解模糊指令

麻省理工CSAIL研究团队开发了"掩码逆强化学习"(Masked IRL)方法,利用大语言模型(LLM)自动解析模糊指令,并筛选机器人执行任务时需关注的关键环境要素。该系统通过运动学示教采集数据,仅需传统方法约五分之一的演示数据量,即可训练机器人在家庭、办公室及工厂场景中安全完成任务,准确识别用户未明确表达的偏好,准确率比基线方法提升最高15%。