最新文章
苏州大学团队突破性发现:现有AI奖励模型遇到长文本就"失忆",全新训练策略让8B小模型击败70B巨头

苏州大学团队突破性发现:现有AI奖励模型遇到长文本就"失忆",全新训练策略让8B小模型击败70B巨头

苏州大学研究团队发现现有AI奖励模型在处理超过4K字符的长文本时准确率急剧下降至随机水平,为此开发了创新的多阶段训练策略。通过"从短到长"的数据合成和一致性投票对齐,他们让8B参数的小模型在长文本任务上击败了70B大模型,性能媲美谷歌Gemini 2.5 Pro,为AI长文本理解能力提升提供了高效解决方案。

AI图像生成新突破:HKUST团队让扩散模型训练速度快30倍

AI图像生成新突破:HKUST团队让扩散模型训练速度快30倍

香港科技大学团队提出DGPO方法,通过直接学习群体偏好信息,让AI图像生成模型训练速度提升30倍。该方法避免了传统强化学习的低效随机探索,使用确定性采样器生成高质量训练样本,在GenEval基准测试中将性能从63%提升至97%。这一突破显著降低了训练成本,为AI图像生成技术的普及和应用奠定了基础。

香港城市大学和阿里巴巴集团联合出击:让AI学会处理模糊不清的问题,一个答案根本不够用!

香港城市大学和阿里巴巴集团联合出击:让AI学会处理模糊不清的问题,一个答案根本不够用!

香港城市大学和阿里巴巴集团联合研究团队开发了A?SEARCH系统,专门解决AI在处理模糊问题时只提供单一答案的局限性。该系统通过自动化流程识别并验证多个合理答案,在八个问答数据库的测试中表现出色,仅用单次回答就超越了需要多次尝试的大型传统系统,为构建更智能的问答AI开辟了新路径。

机器人学会空间移位术:一张照片就能训练出全能操作手

机器人学会空间移位术:一张照片就能训练出全能操作手

清华大学研究团队开发出R2RGen框架,仅需一个人类演示就能训练机器人在不同空间位置灵活操作。该技术突破传统仿真限制,直接处理真实3D数据,通过群组式增强和摄像头感知处理,实现优于25倍数据量传统方法的效果。支持复杂多物体操作和移动机器人应用,为通用机器人助手发展奠定基础。

谷歌将Gemini引入Google TV Streamer设备

谷歌将Gemini引入Google TV Streamer设备

谷歌宣布开始向Google TV Streamer推出Gemini智能助手,取代原有的Google Assistant。用户可通过更自然的语音交互获取内容推荐,如询问适合夫妻共看的电影或了解剧集剧情。Gemini还支持教育和生活指导功能,能解答各类问题并通过YouTube视频提供DIY项目指导。该更新将在未来几周内向18岁以上用户推送,这是谷歌用Gemini全面替代Google Assistant计划的重要步骤。

AI时代的创始人与投资者合作关系

AI时代的创始人与投资者合作关系

在AI快速发展的背景下,创始人与投资者的合作关系变得更加重要。尽管基础模型厂商正主导市场整合,但众多初创企业仍在推动AI创新边界。专家指出,这种合作关系应被视为长期婚姻而非简单商业交易。在竞争激烈的AI市场中,投资者需要更快做出决策,而创始人必须具备快速迭代能力。单位经济学、人才密度和产品扩展能力成为关键评估指标,双方需要建立良好关系以应对这个新兴市场的挑战。

大语言模型侧信道攻击可能泄露用户对话主题

大语言模型侧信道攻击可能泄露用户对话主题

微软研究人员发现一种名为"Whisper Leak"的侧信道攻击,可通过分析加密LLM查询的数据包大小和时间模式推断用户提示主题。攻击者可监控网络流量,识别敏感话题讨论。该攻击对流式响应模型特别有效,在测试中对多个模型达到98%以上准确率。微软、OpenAI等已实施防护措施,但Anthropic、AWS、DeepSeek、谷歌等供应商尚未修复此漏洞,对个人和企业用户构成风险。

超智能可能短期内不会出现,但AI仍将重塑社会

超智能可能短期内不会出现,但AI仍将重塑社会

预测研究所发布报告显示,339名AI专家认为超级智能短期内不会实现,但AI将在2040年前带来重大社会变革。专家预测到2030年,AI将占美国电力使用量7%,协助18%工作时间,为15%成年人提供日常陪伴。全球私人投资将从2024年1300亿美元增至2600亿美元。专家对AI在药物发现和就业影响方面存在分歧,但普遍认为集成和可靠性是主要障碍。

3D世界的"魔术编辑器":华东理工大学团队如何让3D模型修改变得像修图一样简单

3D世界的"魔术编辑器":华东理工大学团队如何让3D模型修改变得像修图一样简单

华东理工大学团队开发了3DEditFormer系统和3DEditVerse数据集,首次实现了无需手工3D遮罩的高质量3D模型编辑。该技术通过双重引导注意力和时间自适应门控机制,让3D编辑变得像2D修图一样简单直观,在游戏开发、影视制作、AR/VR等领域具有广阔应用前景,标志着3D编辑技术向普及化迈出重要一步。

上海AI实验室联合多所高校:破解多模态大模型的"原生训练"难题,让AI真正学会看图说话

上海AI实验室联合多所高校:破解多模态大模型的"原生训练"难题,让AI真正学会看图说话

上海AI实验室联合多所高校突破多模态AI训练难题,提出NaViL原生训练方法。通过预训练语言模型起点、混合专家架构和视觉-语言能力最佳平衡三大创新,在有限资源下实现与拼装式模型相当性能。该研究证明原生训练的可行性,为AI真正理解图文结合提供新思路,有望在教育、医疗等领域带来更自然的人机交互体验。

乔治亚大学研究揭秘:AI助手竟然能成为网络黑客的得力帮手?

乔治亚大学研究揭秘:AI助手竟然能成为网络黑客的得力帮手?

乔治亚大学研究团队通过创建AdvCUA测试平台,首次系统性揭示了主流AI助手存在严重安全漏洞。研究发现,包括GPT、Claude、Gemini等知名AI助手在面对精心设计的恶意指令时,成功执行率可达70%,甚至能完成复杂的端到端网络攻击。现有防护措施效果有限,亟需开发新的AI安全技术。

纽约大学团队发布PUZZLEPLEX:首个同时测试AI推理和编程能力的拼图游戏基准测试平台

纽约大学团队发布PUZZLEPLEX:首个同时测试AI推理和编程能力的拼图游戏基准测试平台

纽约大学团队发布PUZZLEPLEX基准测试平台,首次通过15种拼图游戏同时评估AI的推理和编程能力。研究发现推理模型在对话式问题解答中表现优异,但代码生成能力相对较弱,而开源模型如DeepSeek-R1在某些测试中甚至超越了商业模型,揭示了当前AI技术的真实水平和发展瓶颈。

NYU等校联手突破:让AI写财务分析像配三重保险一样靠谱

NYU等校联手突破:让AI写财务分析像配三重保险一样靠谱

这项由纽约大学等院校完成的研究针对AI在财务分析中的"胡说八道"问题,开发了FINLFQA评测基准。该系统要求AI提供"三重保险":证据支撑、计算过程和专业知识引用。测试八个AI模型发现,GPT-4o表现最佳但仍有局限,开源模型快速进步。研究揭示了AI在专业领域的五大典型错误,为AI财务应用建立了新的评估标准。

时间序列数据的"修复大师":伊利诺伊大学芝加哥分校提出全新算法,让缺失数据重获新生

时间序列数据的"修复大师":伊利诺伊大学芝加哥分校提出全新算法,让缺失数据重获新生

这项由伊利诺伊大学芝加哥分校等机构联合完成的研究,针对时间序列数据填补中的关键问题,提出了Glocal-IB方法。该方法创新性地结合了局部精度和全局一致性,通过引入全局对齐损失机制,使人工智能模型在数据大量缺失时仍能保持整体结构把握。在九个数据集的测试中,即使面对90%的极端缺失情况,该方法仍展现出稳定的性能表现,为医疗监护、智慧交通、工业控制等领域的数据缺失问题提供了实用的解决方案。

OCI升级、26ai亮相:甲骨文驱动的企业AI高效落地

OCI升级、26ai亮相:甲骨文驱动的企业AI高效落地

如今,甲骨文正在构建起多层AI架构:从底层基础架构到数据层、再到应用层,AI都深度嵌入其中,这也是完整的技术堆栈,能够成为企业真正释放AI潜能的关键所在。

PDF协会选择JPEG XL作为首选图像格式

PDF协会选择JPEG XL作为首选图像格式

PDF协会在欧洲会议上宣布,将在PDF规范中添加对JPEG XL图像格式的支持。尽管Chromium团队此前将该格式标记为过时,但此次纳入可能为JXL带来主流应用机会。PDF协会CTO表示,选择JPEG XL作为支持HDR内容的首选解决方案。该格式具备广色域、超高分辨率和多通道支持等优势,但目前仍缺乏广泛的浏览器支持。

Ironclad OS项目:用Ada语言构建Unix内核

Ironclad OS项目:用Ada语言构建Unix内核

Ironclad OS项目正在开发一个新的类Unix操作系统内核,面向小型嵌入式系统,计划支持实时功能。该项目的独特之处在于采用Ada编程语言及其可形式化验证的SPARK子集进行开发,而非常见的C、C++或Rust语言。项目还包含运行在Ironclad内核上的完整操作系统Gloire,使用GNU工具构建以提供传统Unix兼容性。

Majestic Labs获1亿美元融资推出大内存AI服务器

Majestic Labs获1亿美元融资推出大内存AI服务器

人工智能基础设施初创公司Majestic Labs今日宣布成立,并获得1亿美元初始融资。该公司由前谷歌芯片工程高管领导,致力于解决大语言模型对高内存容量的需求挑战。其开发的服务器配备高达128TB内存,相当于10个机架的内存容量,但冷却设备需求大幅减少,显著降低硬件成本和功耗。该服务器采用定制加速器芯片和内部开发的内存接口模块,计划2027年开始交付。

惠普打造中东下一代科技创造者的战略计划

惠普打造中东下一代科技创造者的战略计划

在数字化转型快速发展的中东地区,惠普正通过一系列战略举措重塑教育未来,培养年轻人成为创作者、创新者和企业家。通过在沙特阿拉伯、阿联酋等地开展游戏开发训练营、HP游戏车库等项目,惠普将学术学习与实际行业经验相结合,重点关注游戏、人工智能和数字经济领域,帮助学生从学习技术转向运用技术创造。

网络安全2026年六大预测与应对蓝图

网络安全2026年六大预测与应对蓝图

展望2026年,网络安全领域正面临关键转折点。智能AI将成为攻防新前沿,量子计算威胁迫在眉睫,深度伪造技术让身份欺骗防不胜防,物联网设备扩大攻击面,网络犯罪组织化程度提高,网络安全将成为企业战略支柱而非仅仅是IT成本中心。企业需要从防御思维转向检测、适应和信任机制,建设具有韧性的安全架构。