微软研究院前不久发布了一篇论文,揭示了一个反常识的现象:当我们和AI进行长时间多轮对话时,它们会变得越来越"糊涂",给出的答案质量也会明显下降。微软研究院的这项研究,用严谨的科学方法证实了这个现象的存在,这不是个别模型的问题,而是几乎所有大模型的通病。研究团队测试了包括GPT-4、Claude、Gemini在内的15个主流AI模型,发现它们在多轮对话中的表现平均下降了39%。
该团队介绍,该系统生成的论文“在我们自动审阅者的评估下,已经超过了顶级机器学习会议的接收门槛。”
4月7日,CNN消息,美国伊萨卡学院-战略传播学教授Diane Gayeski,正在使用ChatGPT批改学生的论文。
Meta此次发布的AI系统旨在通过对一部分论文引文审查工作实施自动化,来简化维基百科编辑们的工作。该系统可以扫描一篇文章并识别文章中是否存在有可疑引文的信息片段,此外还能够推荐相关性更高的来源,用这些来源替换有问题的引用。