行为评估文章列表第1页-至顶网频道 - 至顶网

/

行为评估关键字列表

评估大语言模型行为倾向对齐性的系统框架

人工智能

行为评估

对齐性研究

2026-04-07

评估大语言模型行为倾向对齐性的系统框架

本研究提出了一套系统性评估框架，将心理学问卷转化为大规模情境判断测试，用于评估大语言模型的行为倾向。通过对25个模型的分析发现，小型模型在人类共识场景中对齐率较低，大型模型虽有改善但仍存在过度自信问题。研究还发现模型自我报告与实际行为表现存在显著差异，为未来模型行为对齐研究提供了重要基础。

白皮书

更多

数字化转型方略

更多

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证