公共服务可靠性 关键字列表
开放数据研究所发现大语言模型在公共服务信息上不可靠

开放数据研究所发现大语言模型在公共服务信息上不可靠

开放数据研究所研究发现,主流大语言模型无法为健康、税收和福利等关键公共服务提供可靠信息。通过超过2.2万个模拟用户询问的测试,研究人员发现聊天机器人经常给出不完整或错误回答,却很少承认不知道答案。模型还会提供冗长回复,掩盖关键事实或超出政府网站信息范围,增加不准确风险。研究挑战了更大模型总是更适合公共部门的观点,建议政府在AI快速发展中保持谨慎,优先考虑学习和开放性而非快速扩张。