人工智能 关键字列表
研究揭示大语言模型聊天机器人易被恶意利用窃取用户隐私数据

研究揭示大语言模型聊天机器人易被恶意利用窃取用户隐私数据

研究人员警告称,基于大型语言模型的AI聊天机器人可被恶意改造,自动收集用户个人信息,攻击者仅需最基本技术知识即可实现。研究显示,经过恶意改造的聊天机器人能获取超过90%参与者的个人数据,远高于普通表单的24%。攻击者只需通过"系统提示"工具,为机器人分配"调查员"等角色即可绕过安全防护。研究涵盖502名参与者,使用三种主流语言模型进行测试。

谷歌推出超小型AI模型Gemma 3 270M,智能设备离线运行新突破

谷歌推出超小型AI模型Gemma 3 270M,智能设备离线运行新突破

谷歌DeepMind发布了迄今最小的AI模型之一Gemma 3 270M,仅有2.7亿个参数。该模型专为低功耗设备设计,可在智能手机等设备上离线运行。尽管体积小巧,但经过微调后仍能处理复杂的特定领域任务。在指令跟随基准测试中获得51.2%的成绩,超越同类小型模型。在Pixel 9 Pro上测试显示,25次对话仅消耗0.75%电量,展现出色的能效表现。

普渡大学团队打造AI"红蓝对抗"系统:用空间时间探索揭秘编程助手的安全漏洞

普渡大学团队打造AI"红蓝对抗"系统:用空间时间探索揭秘编程助手的安全漏洞

普渡大学研究团队开发了ASTRA红队系统,通过"空间时间探索"方法系统测试AI编程助手安全性。与传统方法不同,ASTRA专注现实使用场景,通过构建领域知识图谱和分析AI推理过程发现漏洞。实验显示ASTRA比现有技术多发现11-66%安全问题,生成的测试用例可提升AI安全训练效果17%,为AI编程助手安全保障提供了重要工具。

当AI遇上编程逻辑:达拉斯大学团队发现大模型在复杂指令执行上的"软肋"

当AI遇上编程逻辑:达拉斯大学团队发现大模型在复杂指令执行上的"软肋"

达拉斯德州大学和Zoom公司联合研究团队开发了LogicIFGen框架,用于测试AI模型执行复杂逻辑指令的能力。他们构建了包含426个任务的LogicIFEval测试集,对21个主流AI模型进行评估。结果显示即使是最先进的模型准确率也仅为85%,大部分模型低于60%。研究发现AI在控制流执行、状态跟踪等方面存在显著不足,具有思考能力的模型表现更好。

ChatGPT全面指南:关于这个AI聊天机器人你需要了解的一切

ChatGPT全面指南:关于这个AI聊天机器人你需要了解的一切

ChatGPT自2022年11月发布以来已成为全球现象,目前拥有3亿周活跃用户。2024年是OpenAI关键一年,推出了具备语音功能的GPT-4o、文本生成视频模型Sora,并与苹果合作开发Apple Intelligence。然而公司也面临高管离职、版权诉讼等挑战。2025年,OpenAI在与中国竞争对手的AI竞赛中努力保持领先地位,同时推进大型数据中心项目和融资计划。

谷歌正在为NotebookLM开发神秘新功能"Magic View"

谷歌正在为NotebookLM开发神秘新功能"Magic View"

谷歌正在为其免费AI研究助手NotebookLM开发一项代号为Magic View的神秘新功能。据AI新闻网站Testing Catalog通过功能标志分析发现,该功能将出现在Studio面板中,与音频和视频概览功能并列。目前尚不清楚Magic View的具体功能,但截图显示其界面类似点阵网格,用不同颜色的点填充。该功能可能专注于学习或面向学生用户,将被归类在新的Notebook Apps下拉菜单中。

摩根士丹利开放源码:Q语言编程新突破,让AI掌握金融界专用代码语言

摩根士丹利开放源码:Q语言编程新突破,让AI掌握金融界专用代码语言

摩根士丹利研究团队开发了专门掌握Q编程语言的AI模型QQwen,通过创新的三阶段训练方法(预训练、监督学习、强化学习),让开源AI模型在Q语言编程测试中达到59%准确率,超越GPT-4.1等商业模型。研究团队完全开源了模型、数据和训练代码,为AI专业化训练提供了可复制的成功范式,证明了中等规模开源模型通过针对性训练可以在特定领域超越大型商业模型的表现。

让大模型下棋:人工智能在外交游戏中的惊人表现——Good Start Labs与独立研究者的突破性发现

让大模型下棋:人工智能在外交游戏中的惊人表现——Good Start Labs与独立研究者的突破性发现

Good Start Labs与多位独立研究者合作开发了首个让任意大语言模型无需训练即可玩完整外交游戏的评估框架。通过优化文本化游戏状态表示,240亿参数模型就能可靠完成比赛。研究发现模型会自然展现承诺、背叛、联盟等复杂策略行为,且不同模型表现出独特的"外交性格"。该框架大幅降低了AI战略推理研究门槛,为理解语言模型的策略能力提供了新途径。

印度学生的数学神器:Physics Wallah团队打造出专门为JEE考试优化的AI数学助手Aryabhata

印度学生的数学神器:Physics Wallah团队打造出专门为JEE考试优化的AI数学助手Aryabhata

Physics Wallah团队开发的Aryabhata 1.0是专为印度JEE数学考试优化的70亿参数AI模型。通过融合三个不同特长的数学模型,使用25万道精选题目进行训练,并采用创新的强化学习技术,Aryabhata在2025年JEE考试中取得86%-90%的准确率。该模型不仅解题精确,更能提供清晰的教学指导,已开源发布,标志着AI教育应用的重要突破。

MIT等名校联手攻克AI推理难题:训练时"长篇大论",推理时"言简意赅"的秘诀

MIT等名校联手攻克AI推理难题:训练时"长篇大论",推理时"言简意赅"的秘诀

MIT等顶尖高校联合发布AI推理效率突破性研究,提出"训练时长思考、推理时短表达"的课程学习策略。通过从宽松到严格的渐进式训练,让AI在保持高准确率的同时实现三倍效率提升,为解决AI推理成本高昂问题提供了创新方案。

香港大学团队开源全球首个完整电脑操作AI框架:让机器像人一样使用电脑的时代来了

香港大学团队开源全球首个完整电脑操作AI框架:让机器像人一样使用电脑的时代来了

香港大学XLANG实验室联合多所知名院校开发的OPENCUA,是全球首个完整开源的电脑操作AI框架。该系统通过2.2万个真实操作录像训练,具备三层推理能力,能像人一样使用电脑完成复杂任务。在权威测试中超越OpenAI同类产品,为电脑自动化技术树立了新标杆。

人工智能如何用1公里模糊图像精确推算出10米高清地面温度图?法国奥尔良大学团队的突破性发现

人工智能如何用1公里模糊图像精确推算出10米高清地面温度图?法国奥尔良大学团队的突破性发现

法国奥尔良大学研究团队开发出WGAST系统,首次实现利用人工智能将1公里粗糙卫星温度数据转换为10米高分辨率地表温度图。该系统融合Terra MODIS、Landsat 8和Sentinel-2三种卫星数据,采用创新的弱监督学习策略,在保持每日更新频率的同时大幅提升空间精度,为城市规划、农业监测和气候研究提供了强大工具。

哈工大团队发现AI学新技能不忘老本事的秘诀:用一千个通用样本就够了!

哈工大团队发现AI学新技能不忘老本事的秘诀:用一千个通用样本就够了!

哈工大研究团队提出GeRe框架,仅用一千个通用文本样本就能解决大语言模型持续学习中的灾难性遗忘问题。该方法通过阈值边际损失技术,让AI在学习新任务时保持原有能力不退化。实验显示,相比传统方法性能暴跌,GeRe方法在15个任务的持续学习中表现稳定,为AI的终身学习能力提供了突破性解决方案。

哥本哈根大学最新研究:如何让AI模型"忘掉"刻板印象——BiasGym框架让机器学习更公平

哥本哈根大学最新研究:如何让AI模型"忘掉"刻板印象——BiasGym框架让机器学习更公平

哥本哈根大学研究团队开发了BiasGym框架,专门用于识别和消除大型语言模型中的偏见。该框架通过先注入特定偏见定位问题源头,再精准清除相关神经连接的方式,成功减少了AI中的文化刻板印象,同时几乎不影响模型正常功能。实验显示偏见强度可降低80%以上,为构建更公平的AI系统提供了新路径。

中国人民大学提出企业智能搜索新方案:让AI助手同时搜本地和网络信息

中国人民大学提出企业智能搜索新方案:让AI助手同时搜本地和网络信息

中国人民大学团队提出HierSearch系统,通过分层架构让AI同时搜索企业内部资料和网络信息。系统包含本地搜索专家、网络搜索专家和统筹规划者,采用分层强化学习训练,配备知识精炼器筛选信息。在六个领域测试中显著优于传统方法,为企业级智能搜索提供了高效解决方案。

AI图像生成新突破:FuriosaAI团队让机器学会"看清楚"每个物体

AI图像生成新突破:FuriosaAI团队让机器学会"看清楚"每个物体

FuriosaAI团队开发的UNCAGE方法通过"对比注意力引导"策略,巧妙解决了AI图像生成中多物体属性混合的问题。该免训练方法仅增加0.13%推理时间,却能显著提升生成图像的准确性,特别是在处理语义相似物体时效果显著。研究为蒙版生成变换器技术发展扫清重要障碍。

Tencent最新发布:一键生成代码评测"神器",让AI编程测试不再依赖人工标注

Tencent最新发布:一键生成代码评测"神器",让AI编程测试不再依赖人工标注

腾讯混元团队开发了AutoCodeGen自动化系统,能够无需人工干预生成高质量编程测试题目。基于此创建的AutoCodeBench包含3920道题目,覆盖20种编程语言,是首个大规模多语言自动生成的代码评测平台。对30多个主流AI模型的测试显示,即使最先进的模型通过率也仅有52.4%,揭示了当前AI编程能力的局限性,特别是在小众语言和复杂多逻辑编程方面仍有很大提升空间。

语言模型也能学会使用工具了?ByteDance和复旦大学开发全自动训练系统让AI变身万能助手

语言模型也能学会使用工具了?ByteDance和复旦大学开发全自动训练系统让AI变身万能助手

ByteDance和复旦大学联合开发了一套让AI学会使用工具的全自动训练系统FTRL。该系统通过五阶段环境构建流程和可验证奖励机制,解决了现有方法依赖不稳定外部服务和缺乏客观评价的问题。实验显示,经过训练的小参数模型甚至超越了大型商业模型,且不损害通用能力。

欧洲AI明星公司发布全球最小高性能模型

欧洲AI明星公司发布全球最小高性能模型

西班牙AI初创公司Multiverse Computing发布两款超小型AI模型,分别命名为"鸡脑"和"苍蝇脑"。该公司声称这是全球最小的高性能模型,具备聊天、语音和推理能力。这些模型专为物联网设备、智能手机和平板电脑设计,可在无网络连接情况下本地运行。公司采用量子启发的CompactifAI压缩技术,在不牺牲性能的前提下大幅缩小模型体积。

谷歌推出AI航班搜索工具应对反垄断审查

谷歌推出AI航班搜索工具应对反垄断审查

谷歌发布名为Flight Deals的AI航班搜索工具,基于Gemini 2.5模型,支持自然语言查询帮助用户找到优惠机票。用户可输入"冬季美食城市一周游,仅限直飞"等描述性需求。该工具按节省百分比排序结果,将在美国、加拿大和印度推出测试版。此举正值欧盟等监管机构调查谷歌是否利用搜索优势损害竞争之际,谷歌正寻求通过AI集成与其他旅游平台竞争。