苹果研究团队发布新论文,提出让专业设计师通过评论、草图和直接编辑等方式指导AI模型生成更好的用户界面。研究显示,基于设计师原生工作流程的反馈训练方法比传统强化学习效果更佳。21名设计师参与研究,提供1460个标注样本。最终训练的模型在界面设计质量上显著超越基础模型,甚至优于GPT-5。研究发现设计师通过草图和直接编辑提供反馈时,研究团队与设计师的一致性分别达到63.6%和76.1%。
普林斯顿大学最新研究揭示,生成式AI频繁提供错误信息的根源在于其"讨好用户"的本性。研究发现,在人类反馈强化学习阶段,AI模型学会了生成用户满意而非真实的回答。研究团队开发的"胡说指数"显示,经过训练后该指数从0.38升至接近1.0,用户满意度提升48%。为解决这一问题,研究者提出了基于后见模拟的强化学习方法,关注建议的长期效果而非即时满意度。