亚马逊发布Lens Live AI功能,用户可通过手机摄像头扫描任何物品进行实时购物。该技术利用人工智能识别用户拍摄的物品,并在亚马逊平台上匹配相关商品,提供即时购买选项。这一创新功能将大幅简化购物流程,用户只需"看到即可购买",为在线购物体验带来革命性改变。
巴黎理工学院研究团队发现了比传统深度伪造更隐蔽的"局部伪造"技术威胁。这种只修改视频局部区域的新型AI造假技术让人类检测准确率下降30%以上,AI检测系统性能下降高达43%。研究团队构建了包含25000个样本的全球首个局部伪造检测数据库FakePartsBench,揭示了现有防御体系面对精细化伪造攻击的脆弱性,为未来开发更强大的检测技术奠定重要基础。
谷歌AI研究助手NotebookLM宣布推出三种全新音频摘要格式:简要、评论和辩论模式。这一更新将为用户提供更多选择,让已经备受欢迎的音频概览功能更加丰富多样。简要模式提供1-2分钟的精简概述,评论模式对材料进行建设性反馈,辩论模式则让两个AI主持人就内容展开深入讨论。这些新格式有助于用户从不同角度理解学习材料,使NotebookLM成为更加细致入微的学习工具。
Meta等机构研究发现,让大语言模型学会使用外部工具比死记硬背所有知识更高效。研究通过数学证明和实验验证,传统的参数记忆存在严格容量限制,而工具学习能实现无限扩展且不损害原有能力。这为AI发展提供了新思路:从堆叠参数转向构建智能工具协作系统。
法国生物制药公司赛诺菲正在大规模应用AI技术进行数字化转型,将AI整合到从新分子识别到药物配送的整个价值链中。公司通过数字加速器项目,结合预测模型和机器学习算法,可预测80%的物流中断。与谷歌云等合作伙伴携手,开发内部AI应用plai。巴塞罗那全球创新中心将创造300多个高技能岗位,专注于临床分析和预测模型开发,旨在提供更快速、精准的医疗解决方案。
ROSE是一项突破性的视频编辑技术,能够彻底移除视频中的物体及其环境影响。由浙江大学等机构研发,该系统不仅删除目标物体,还智能处理阴影、反射、光照等五种副作用。通过3D渲染生成训练数据,采用引用式擦除和差异掩码预测等创新方法,ROSE在各项性能指标上全面超越现有技术,为视频编辑领域带来了新的可能。
AI是一把双刃剑,既能解放员工免于繁重工作,也可能夺走创造性任务。虽然今年已有超过8万名科技员工被裁,但企业领导者正寻求通过AI增强而非替代员工的策略。Parsons等公司投资培训项目,提升员工技能,实现了十年来最佳留任率。汤森路透采用"AI优先、人类主导"策略,部署Open Arena平台供员工实验AI工具。专家认为,AI将创造新就业机会,关键是企业要有积极愿景,通过技能提升帮助员工适应新角色。
新加坡南洋理工大学研究团队提出TriMM系统,这是首个融合RGB图像、深度图和点云数据的3D生成模型。通过协同多模态编码技术,系统能够同时利用彩色图像的丰富纹理和几何数据的精确结构信息,仅用4秒即可从单张图片生成高质量3D模型。该技术在多个数据集上的表现超越现有方法,为3D内容创作提供了新的解决方案。
云网络公司Cato Networks宣布收购以色列AI安全公司Aim Security,收购金额未披露。Aim Security成立于2022年,专注保护员工、应用程序和组织与AI的交互,提供AI使用的可见性、控制和治理。该平台可监控ChatGPT、微软Copilot等公共AI应用的使用,发现影子AI使用情况并降低风险。此次收购将使Cato Networks的SASE云平台扩展新的AI安全功能。
微软研究院开发的rStar2-Agent是一个仅140亿参数的AI数学推理模型,通过创新的智能体强化学习方法,在AIME24数学竞赛中达到80.6%准确率,超越了6710亿参数的DeepSeek-R1等大型模型。该模型的核心创新包括GRPO-RoC算法、分布式代码执行环境和渐进式训练策略,仅用510个训练步骤和一周时间就达到顶级性能,展示了"小模型大能力"的技术路径,为AI发展提供了高效替代方案。
API管理工具厂商Kong宣布收购开源使用计量和计费平台开发商OpenMeter。此次收购将为Kong Konnect平台增加原生货币化功能,帮助企业大规模计量、定价和货币化API、AI令牌及数据流。随着API成为AI模型和服务的主要接口,传统计费系统面临挑战。整合预计2026年初完成,OpenMeter的7人团队全部加入Kong。
斯坦福大学和字节跳动联合研究团队开发出混合上下文(MoC)技术,革命性地解决了AI长视频生成中的记忆与计算难题。该技术将视频生成重新定义为信息检索问题,通过智能选择最相关历史信息,实现了85%稀疏化率,计算效率提升7倍,生成速度提升2.2倍,能稳定生成分钟级高质量连贯视频,为视频创作民主化开辟新路径。