清华大学团队发布OpenGPT-4o-Image数据集,包含8万个精心设计的指令-图像配对样本,系统性地提升AI图像生成和编辑能力。该数据集首次建立了完整的能力分类体系,涵盖风格控制、复杂指令理解、文字渲染、空间推理和科学图像生成等五大模块,实验证明能将AI性能提升12-21%,为AI工具的实用化发展奠定重要基础。
浙江大学研究团队开发的EasySteer框架,通过操控AI模型内部"思维向量"实现精准行为控制,性能比现有框架提升5.5-11.4倍。该系统支持安全控制、推理优化等八大应用场景,提供完整工具套件和可视化界面,将AI控制从复杂研究技术转化为实用开发工具,为可控AI时代奠定重要基础。
北京人工智能研究院等机构联合开发了EditScore系统,解决了AI图像编辑评价难题。该研究建立了包含13种编辑任务的评价标准EditReward-Bench,开发了专业的AI评价模型EditScore,并首次在图像编辑领域成功应用强化学习。EditScore的评价准确性超越了GPT-5,通过其指导的强化学习训练显著提升了AI修图质量,为智能图像编辑工具的发展奠定了重要基础。
浙江大学研究团队通过开发GSM8K-V视觉数学推理基准,发现了AI技术的一个重大盲点:最先进的视觉语言模型在处理图片形式的数学题时表现远不如文字版本。该研究将1319道数学题转换为连环画式的多图场景,测试结果显示即使是表现最好的AI模型准确率也从95%骤降至47%,揭示了当前AI在视觉数学推理方面的根本性缺陷。
NVIDIA联合多所顶尖大学开发的SANA-Video模型实现重大突破,仅需RTX 5090显卡就能在29秒内生成5秒720p视频,速度比传统模型快16倍,成本降低99%。该模型采用线性注意力机制和固定内存设计,支持生成长达1分钟的高质量视频,在多项评测中表现优异,有望让高质量视频生成技术走向普及。
新加坡国立大学研究团队开发出SparseD技术,针对扩散语言模型的注意力机制进行优化。通过发现并利用注意力头的个性化模式、跨步骤的模式稳定性以及早期生成阶段的关键性,实现了在保持文本质量的同时将生成速度提升最多50%,为长文本AI应用提供了重要技术突破。
伊利诺伊大学团队通过精心设计的字符串转换实验,证明大型语言模型能够通过强化学习学会组合已有技能形成新能力。研究发现仅提供组合数据还不够,必须配合强化学习才能激发真正的组合推理能力。这种技能还能跨任务迁移,为AI发展提供了重要启示。
上海AI实验室开发的SDLM技术革命性地解决了AI语言模型生成速度慢的问题。通过"下一序列预测"和智能置信度检测,SDLM能根据内容复杂程度动态调整生成长度,在保持高准确性的同时将生成速度提升一倍以上,为AI助手的实用化应用开辟了新路径。
这项由伊利诺伊大学厦巴纳-香槟分校和滑铁卢大学联合完成的研究,开发了名为VideoScore2的AI视频评估系统,能够像人类专家一样从视觉质量、文本对齐和物理一致性三个维度对AI生成视频进行详细评估,并提供透明的分析过程。该系统在多项测试中显著超越现有评估工具,在准确率上提升近6个百分点,为AI视频行业提供了标准化、可解释的质量评估解决方案,有望推动整个领域的技术进步。
OpenAI于周二发布AI浏览器ChatGPT Atlas,目标是让ChatGPT成为搜索和问答的首选界面而非谷歌。该浏览器目前仅支持Mac,但正在开发Windows、iOS和Android版本。Atlas将ChatGPT设为默认搜索选项,并具备记忆功能,可结合浏览历史提供个性化答案。与其他AI浏览器不同,Atlas更专注于强化ChatGPT生态系统,为OpenAI提供更多用户数据和分发控制权,而非改善传统浏览体验。
通用汽车宣布计划于2028年推出自动驾驶系统,允许驾驶员双眼离开道路、双手离开方向盘,首先应用于凯迪拉克Escalade IQ。该系统基于现有Super Cruise技术,采用激光雷达、雷达和摄像头感知技术,初期在高速公路使用。通用整合了已关闭的Cruise子公司的技术栈,包括基于500万英里无人驾驶数据训练的AI模型。目前美国仅奔驰拥有商用L3级自动驾驶系统。
机器学习的突破性进展颠覆了传统数据中心架构,AI模型训练的计算需求持续增长。MLPerf训练基准测试作为标准化框架应运而生,用于评估机器学习性能,帮助数据中心专业人员做出符合快速发展工作负载需求的基础设施决策。该基准测试通过"训练时间"这一核心指标,为不同系统提供公平比较标准。
亚马逊在年度技术大会上发布了多项创新技术,包括集成三套系统于一体的多臂机器人系统Blue Jay,以及帮助仓库管理者实时决策的AI助手Project Eluna。此外,公司还在开发智能配送眼镜,为配送员提供免手持导航和包裹扫描功能。Blue Jay机器人系统能够高效分拣数千件商品,大幅提升物流处理速度。这些技术体现了亚马逊在"物理AI"领域的领先地位,旨在提升员工工作安全性和客户服务体验。
MariaDB企业平台2026版本集成了RAG管道和AI代理支持,并通过基于Exasol的Exa内存引擎显著加速分析处理。该平台将事务、分析和AI数据库引擎统一到单一高性能平台中,支持检索增强生成管道和AI代理。新版本提供开箱即用的RAG功能,内置自然语言交互的AI副驾驶,包括开发者和DBA助手。MariaDB Exa分析引擎处理多TB复杂分析的速度比传统OLTP引擎快1000倍以上。
戴尔AI数据平台新增基于Elastic的数据搜索引擎和Starburst构建的数据分析引擎,同时加入数据分析引擎代理层、MCP服务器及英伟达cuVS集成。该平台分离存储与计算,专为AI训练、微调、检索增强生成和推理等工作负载设计,旨在简化数据复杂性、统一管道并大规模交付AI就绪数据。
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
JetBrains发布开发者生态系统调查报告,收集超过24500份回复,揭示了AI对开发工具和编程语言趋势的影响,声称PHP和Ruby正处于"长期衰落"。调查显示68%的开发者认为AI技能将成为工作要求,85%使用AI编码工具,ChatGPT最受欢迎。然而仅44%开发者在工作流程中完全或部分采用AI。调查还指出TypeScript五年来显著增长,而PHP、Ruby和Objective-C处于长期衰落趋势。
本届进博会上,西门子将带来10余款工业AI产品与解决方案,并集中呈现其工业AI技术在多个行业的实际落地成果。
由厦门市人民政府主办,厦门国际动漫节组委会承办,中国电信、亚马逊云科技(AWS)与Unity中国团结引擎、Tripo共同协办的“金海豚奖”48小时游戏开发大赛,在这座充满创新活力的海滨城市再次掀起创意浪潮。
OpenAI发布ChatGPT Atlas AI浏览器,支持网页问答、历史查询和邮件改写等功能。同时曝光秘密项目Mercury,雇佣约100名前投行精英以每小时150美元训练AI金融模型。公司还因用户滥用Sora生成马丁·路德·金视频而暂停相关功能。此外,医疗AI搜索引擎OpenEvidence获2亿美元融资,估值60亿美元。