亚马逊CEO贾西宣布,AWS实用计算产品高级副总裁彼得·德桑蒂斯将领导新的AI组织,专注于Nova模型发展、定制芯片开发和量子计算。作为领导层变动的一部分,德桑蒂斯将接管人工通用智能团队,原负责人罗希特·普拉萨德将于2025年底离职。新组织还包括皮特·阿贝尔领导前沿模型研究团队。
微软亚洲研究院与清华大学联合提出双向感知塑造技术,通过创新的两阶段训练方法解决AI视觉理解中的关键问题。该技术让AI学会正确聚焦重要视觉信息,避免被无关内容误导。仅用1.3万训练样本就在八个基准测试中平均提升8.2%性能,超越使用数十万样本的专门模型,为AI视觉推理能力提升开辟新路径。
最新调查显示,近半数CIO将AI采用和自动化提升列为未来五年的首要任务。超过三分之一的受访者将加强业务连续性和灾难恢复作为重点,同等比例的企业将人才技能发展列为优先事项。尽管AI投资成为焦点,但投资回报率仍不明朗,近三分之二的商业领袖估计AI投资回报率仅为50%或更低。
上海交通大学研究团队开发了TimeBill框架,解决大语言模型在实时应用中的时间不确定性问题。该系统通过精确预测回答长度和执行时间,动态调整AI记忆管理策略,确保在规定时间内完成任务的同时保持回答质量。实验显示TimeBill在各种时间预算下都能实现最佳的完成率与性能平衡,为AI在自动驾驶、工业控制等安全关键领域的应用提供了重要技术支撑。
红帽公司宣布收购伦敦AI公司Chatterbox Labs,该公司专注于模型测试和生成式AI护栏技术。此次收购将为红帽AI产品组合增加自动化AI风险评估、安全测试和治理功能。Chatterbox Labs的AI风险指标帮助企业验证数据和模型是否符合国际法规,提供模型无关的稳健性、公平性和可解释性测试。收购将增强红帽的AI安全能力,包括生成式AI护栏、模型透明度和预测性AI验证等功能。
中山大学研究团队开发了名为ProEdit的AI图像编辑新技术,解决了传统方法在编辑图片时经常"误伤"背景的问题。该技术通过KV-Mix和Latents-Shift两个核心模块,能够精准修改目标区域而完美保持背景不变,支持图片和视频编辑,具有即插即用的特点,可集成到现有各种编辑工具中,大幅提升编辑效果。
根据Gartner最新报告,微软凭借广泛的合作伙伴和平台生态系统在企业级AI领域占据主导地位,而谷歌凭借集成的AI代理技术栈和可扩展的企业采用支持在企业代理AI方面领先。报告涵盖近30个AI技术竞赛领域,包括数据基础设施、模型代理、行业解决方案和网络安全等类别。尽管科技巨头投入数十亿资金扩展AI基础设施,但企业仍在努力证明AI技术的商业价值,超过三分之二的企业困于生成式AI试点阶段。
由香港科技大学和阿里巴巴通义千问团队联合开发的SWE-RM,是首个能够全面评估AI代码质量的执行无关反馈系统。该系统突破了传统二元评分局限,具备准确选择最优解、全面区分代码质量和可靠分数校准三大核心能力。在SWE-Bench Verified测试中,SWE-RM将模型成功率从51.6%提升至62.0%,达到开源模型最佳性能,为AI编程学习和软件开发质量评估提供了重要技术突破。
美国国家标准与技术研究院发布人工智能网络安全框架配置文件草案,旨在帮助组织安全使用AI系统。该文件围绕"安全"、"防御"和"阻止"三个重点领域,详细说明如何管理不同AI系统的网络安全挑战、利用AI增强网络防御能力以及阻止AI驱动的网络攻击。文件将网络安全框架的各个组件映射到具体建议上,覆盖入侵检测到供应链安全等各个方面。
上海AI实验室团队首次提出统一的感知层面图像理解框架UniPercept,让AI能像人类一样从美学、质量和结构三个维度全方位评估图像。研究构建了包含6000张精标注图像的基准数据集,训练出的模型在各项测试中显著超越现有专门化系统,并成功应用于图像生成模型优化。这项技术为降低视觉内容创作门槛、提升AI视觉理解能力提供了重要突破。
联想此次推出的推理加速引擎(Inference Acceleration Engine),是联想携手清华大学无问芯穹团队联合打造的本地AI加速解决方案。这款引擎将预装在联想年底发布的新一代AI PC产品线中,目标是让端侧推理性能直接看齐云端大模型水平。
由上海AI实验室等机构联合开发的Omni-Weather是首个统一的多模态天气AI模型,能同时进行天气预测和理解分析。该模型集成了雷达预测、图像生成、数据理解等四大功能,并创新性地引入思维链技术,让AI能像气象专家一样解释推理过程。实验显示其性能全面超越现有专业化模型,为天气AI发展开辟了新方向。