安全评估 关键字列表
MIT研究发现:AI智能体快速发展但缺乏控制

MIT研究发现:AI智能体快速发展但缺乏控制

MIT最新研究调查了30个主流AI智能体系统,发现这些系统在安全性和透明度方面存在严重问题。研究显示大多数智能体缺乏基本的披露信息,无法追踪执行过程,甚至缺少停止运行的选项。许多系统不会向用户表明其AI身份,也没有进行充分的安全评估。OpenAI、IBM等公司对研究结果提出异议,但专家警告随着智能体能力增强,治理挑战将更加突出。

ChatGPT Health在医疗紧急情况识别中存在严重安全隐患

ChatGPT Health在医疗紧急情况识别中存在严重安全隐患

《自然医学》杂志研究显示,ChatGPT健康功能在超过半数紧急医疗情况下未能正确识别需要急诊治疗的病例,甚至在84%的模拟场景中将呼吸衰竭患者建议延后就医。该功能还经常漏检自杀倾向,专家警告这可能导致不必要的伤害和死亡。研究人员通过60个真实医疗场景测试发现,51.6%需要立即就医的病例被建议居家观察,而64.8%的安全个案却被建议紧急就医。

急刹事件作为道路风险评估新指标研究

急刹事件作为道路风险评估新指标研究

研究通过Android Auto平台收集的急刹车事件数据,与实际道路交通事故率建立了显著正相关关系。分析加州和弗吉尼亚州10年公共事故数据发现,急刹车事件覆盖的路段数量是报告事故路段的18倍,能够提供连续的高密度安全信号。研究验证了急刹车事件作为交通安全领域"领先指标"的有效性,为道路风险评估提供了新的数据驱动方法。

AI安全监管亟待加强,头部科技公司评分不及格

AI安全监管亟待加强,头部科技公司评分不及格

未来生命研究所最新发布的AI安全指数显示,大型科技公司在AI安全方面表现不佳,最高仅获得C+评级。该指数评估了包括Anthropic、谷歌、Meta、OpenAI等六家主要AI实验室的透明度、技术保障和治理实践。最令人担忧的是,没有一家公司在"存在性安全"类别中获得及格分数,均无法提出可信的超级智能系统控制方案。研究表明AI能力提升速度远超安全保障发展。

特斯拉首次发布更诚实的FSD碰撞数据

特斯拉首次发布更诚实的FSD碰撞数据

特斯拉发布了监督式FSD系统的碰撞数据,报告了不同配置车辆在不同道路上每次碰撞的平均行驶里程。这取代了多年来备受争议的自动驾驶数据。新数据显示,使用FSD的特斯拉在城市街道的安全记录比未使用FSD的同类车型好1.5倍,比缺乏ADAS系统的老款特斯拉好4倍。在北美,这一记录提升近2倍。不过考虑到特斯拉过往数据造假的历史,这些数据仍需谨慎分析。