最新文章
贝尔法斯特女王大学突破性研究:让AI"看懂"企业流程图,不再依赖底层数据文件

贝尔法斯特女王大学突破性研究:让AI"看懂"企业流程图,不再依赖底层数据文件

贝尔法斯特女王大学研究团队开发出一套创新的AI系统,能够直接从图片中识别和解析BPMN业务流程图,无需原始数据文件。该系统结合视觉-语言模型和光学字符识别技术,在202个真实企业流程图上测试了14种不同AI模型,发现顶级模型如GPT-4.1表现最佳。这项技术为企业数字化转型和流程自动化分析提供了新的解决方案,特别适用于处理大量历史流程文档。

卡尔斯鲁厄理工学院突破性研究:让AI同时"听"和"看"完成翻译,速度比传统方法快1秒

卡尔斯鲁厄理工学院突破性研究:让AI同时"听"和"看"完成翻译,速度比传统方法快1秒

这项研究开发了OmniFusion翻译系统,能同时处理语音和图像信息进行翻译。通过巧妙融合多模态感知模型和专业翻译模型,该系统实现了比传统方法快1秒的实时翻译,同时显著减少了翻译错误。系统在多个测试中表现优秀,特别是在需要结合图像信息的翻译场景中取得突破性进展,为国际会议、商务展示、在线教育等应用提供了新的技术解决方案。

新加坡南洋理工大学重磅发布:AI驾驶员能像人类一样思考推理了!

新加坡南洋理工大学重磅发布:AI驾驶员能像人类一样思考推理了!

新加坡南洋理工大学研究团队开发的OpenREAD系统,首次让自动驾驶AI具备了真正的思考推理能力。通过强化学习微调和大语言模型评判机制,该系统不仅能执行驾驶操作,还能理解复杂路况背后的逻辑并做出合理解释。实验显示,OpenREAD在轨迹规划和驾驶知识理解方面都实现了显著提升,为自动驾驶技术向更智能、更安全的方向发展提供了新思路。

液体团队打造手机里的"超级AI大脑":LFM2能让你的设备拥有媲美大型AI的智慧

液体团队打造手机里的"超级AI大脑":LFM2能让你的设备拥有媲美大型AI的智慧

液体AI团队发布LFM2系列模型,这是专为边缘设备优化的新一代AI助手,能在普通手机上实现媲美大型AI服务器的智能水平。LFM2采用创新混合架构,运行速度比同类产品快2倍,支持完全本地化处理,确保用户隐私安全。该系列包含多个规模版本及视觉、语音、检索等专门变体。

中南大学研究团队让AI像苏格拉底一样思考,破解遥感图像"假推理"难题

中南大学研究团队让AI像苏格拉底一样思考,破解遥感图像"假推理"难题

中南大学研究团队针对AI在遥感图像推理中的"假推理"问题,开发出RS-EoT技术。该方法让AI像苏格拉底一样通过不断提问搜集证据进行推理,而非依赖单次观察。通过SocraticAgent生成训练数据和两阶段强化学习,RS-EoT-7B在多个遥感任务上显著优于现有模型,为城市规划、环境监测等应用提供更可靠的AI推理能力。

赫瑞-瓦特大学团队发布Script:让多模态大模型"瘦身"的智能图像压缩新方法

赫瑞-瓦特大学团队发布Script:让多模态大模型"瘦身"的智能图像压缩新方法

赫瑞-瓦特大学研究团队在《机器学习研究汇刊》发表突破性研究,推出Script智能图像压缩方法。该技术通过图结构分析和查询感知机制,能将多模态大模型的计算量减少90%的同时保持近乎完美的准确性,实现10倍速度提升,为AI技术在移动设备和边缘计算场景的普及应用铺平道路。

UNC和Adobe联手打造"眼神追踪"AI系统 看懂人类意图还能提前预知行为

UNC和Adobe联手打造"眼神追踪"AI系统 看懂人类意图还能提前预知行为

北卡罗来纳大学教堂山分校和Adobe研究院联合开发了STREAMGAZE,全球首个眼神追踪流媒体视频理解基准测试系统。该系统能分析人类眼神移动模式理解注意力焦点和认知过程,甚至预测下步行动。研究发现当前最先进AI模型在眼神理解方面表现极差,准确率仅50%左右,远低于人类82.7%水平,揭示了AI在理解人类认知机制方面的重大局限性。

上海交大团队破解视频AI实时处理难题:让智能助手"眼疾手快"不再是梦

上海交大团队破解视频AI实时处理难题:让智能助手"眼疾手快"不再是梦

上海交大研究团队开发出流式令牌压缩技术STC,通过缓存复用和智能剪枝两大模块,解决了视频AI实时处理的效率瓶颈。该技术在保持99%准确率的同时,将视觉编码和语言模型处理延迟分别降低24.5%和45.3%,为智能眼镜、自动驾驶、实时监控等应用提供了关键技术支撑。

首个智能指令自动优化系统诞生!剑桥大学让AI自己学会写更好的指令

首个智能指令自动优化系统诞生!剑桥大学让AI自己学会写更好的指令

剑桥大学研究团队开发出首个智能指令自动优化系统INSPO,让AI能够在学习过程中自动改进自己的工作指令。该系统通过维护动态指令群体和基于失败经验的反思机制,实现了指令与AI策略的协同进化。实验显示INSPO在多个问答任务上比现有最佳方法提升6%以上准确率,额外计算开销仅为1.4%,代表了AI自我优化能力的重要突破。

悉尼大学团队破解AI画图"文化失明"之谜:为何AI总画不出地道的中国建筑?

悉尼大学团队破解AI画图"文化失明"之谜:为何AI总画不出地道的中国建筑?

悉尼大学团队发现AI绘画模型存在"文化失明"问题,即用不同语言描述同样事物时,AI往往生成文化中性或英语偏向的图像。研究发现问题源于文化知识激活不足而非缺失,开发出CultureBench评估体系和双重解决方案,通过定位文化敏感神经元实现精准调控,显著提升跨语言文化一致性表达能力。

香港理工大学新突破:让AI像人脑一样聪明分配"脑力",数学推理效率暴增50%

香港理工大学新突破:让AI像人脑一样聪明分配"脑力",数学推理效率暴增50%

香港理工大学研究团队提出SCALE框架,通过模拟人脑双重思维模式,让AI根据子问题难度智能分配计算资源。该方法在数学推理测试中将准确率提升13.75个百分点,同时降低计算成本33%-53%,为AI资源优化提供了新思路。

俄罗斯研究团队开发Wikontic:让AI构建像百科全书一样准确的知识图谱

俄罗斯研究团队开发Wikontic:让AI构建像百科全书一样准确的知识图谱

俄罗斯认知AI系统实验室开发的Wikontic技术,通过大语言模型从文本中自动构建高质量知识图谱。该系统结合维基数据约束和多阶段精化处理,在保证知识准确性的同时显著降低计算成本,在多项基准测试中表现优异,为解决AI"幻觉"问题提供了实用解决方案。

大脑解码新突破:巴斯克大学让计算机直接"听懂"大脑中的语音和音素

大脑解码新突破:巴斯克大学让计算机直接"听懂"大脑中的语音和音素

巴斯克大学研究团队开发了MEGConformer系统,能从脑磁图信号中直接识别语音活动和音素内容。该系统采用Conformer架构处理306通道脑信号,在LibriBrain竞赛中取得突破性成绩:语音检测达88.9%准确率,音素分类达65.8%准确率,双双进入前10。关键创新包括实例级归一化解决分布偏移、MEGAugment数据增强技术和动态分组策略,为脑机接口技术向临床应用发展奠定重要基础。

上海AI实验室首创CauSight:让AI具备"透视因果关系"的超能力

上海AI实验室首创CauSight:让AI具备"透视因果关系"的超能力

上海AI实验室开发的CauSight模型首次让AI具备了视觉因果推理能力,能够理解图像中物体间的因果关系而非仅仅识别物体。研究团队构建了包含32000张图片的VCG-32K数据集,采用创新的"因果思维树"训练方法和强化学习优化。CauSight性能比GPT-4.1提升3倍,将推动机器人、自动驾驶等领域的智能化发展。

扩散模型的"反向恢复术":香港科技大学团队破解图像编辑中的"时间倒流"难题

扩散模型的"反向恢复术":香港科技大学团队破解图像编辑中的"时间倒流"难题

香港科技大学团队发表的POLARIS研究解决了扩散模型图像编辑中的核心难题——反演过程的误差累积。该方法通过动态调整引导强度,从根源上消除累积误差,只需一行代码即可集成。在COCO2017等数据集上,POLARIS在图像重建质量上提升了57%,在复杂编辑任务中也表现出色,为图像编辑技术带来了突破性进展。

罗格斯大学团队让AI画画速度快十倍:一步生成高质量图像的全新方法

罗格斯大学团队让AI画画速度快十倍:一步生成高质量图像的全新方法

罗格斯大学研究团队开发出名为Rectified MeanFlow的革命性AI图像生成技术,实现了仅需一步操作就能生成高质量图像的突破。该方法巧妙结合轨迹矫正和平均速度建模两种技术,在保证图像质量的同时将训练效率提升了数倍。在ImageNet数据集的全面测试中,新方法在不同分辨率下都显著超越现有一步生成方法,同时大幅降低了计算成本,有望让高质量AI图像生成技术更加普及。

经典系列回归,戴尔重启 XPS 产品线
2026-01-08

经典系列回归,戴尔重启 XPS 产品线

XPS 品牌以全新设计语言回归,在戴尔历史上最轻薄的机身中延续工艺传承。

Adobe Research最新突破:让AI像魔术师一样随意重塑视频中的运动轨迹

Adobe Research最新突破:让AI像魔术师一样随意重塑视频中的运动轨迹

Adobe Research团队开发出革命性视频编辑技术Edit-by-Track,通过控制三维点轨迹实现摄像机和物体运动的精确联合编辑。该技术采用创新的三维轨迹调节器和两阶段训练策略,在保持视频场景连贯性的同时,实现了人体动作迁移、形状变形、物体移除等多种编辑功能,为视频创作开启全新可能性。

戴尔、惠普、联想与苹果分道扬镳:选择可维修笔记本设计

戴尔、惠普、联想与苹果分道扬镳:选择可维修笔记本设计

当苹果持续追求更薄更轻的MacBook设计时,戴尔、惠普和联想等PC厂商却反其道而行。苹果硅芯片MacBook虽然性能出色且更加轻薄,但集成化设计使用户无法轻松升级内存和固态硬盘。PC厂商听取客户反馈,推出更易维修和升级的笔记本产品,用户可自行更换键盘、电池等部件,无需购买全新设备。

MPS推出车规级TFT LCD偏压驱动IC,可广泛适用多种车载显示屏场景
2026-01-08

MPS推出车规级TFT LCD偏压驱动IC,可广泛适用多种车载显示屏场景

近日,MPS芯源系统(NASDAQ代码:MPWR)发布车规级薄膜晶体管液晶显示器(TFT LCD)偏压驱动器——MPQ5613D-AEC1。