香港科技大学研究团队开发了MOSS-ChatV视频AI系统,通过创新的"过程推理奖励"机制解决了现有视频AI推理过程不一致的问题。该系统不仅能准确预测视频中的未来事件,还能提供清晰的推理解释。研究构建了MOSS-Video数据集,采用动态时间规整算法训练模型,在多个视频理解任务上取得显著性能提升,为视频AI的可解释性发展开辟了新方向。
伯克利大学研究团队通过测试15个AI模型在五种推理策略上的表现,发现AI的"思考方式"直接影响答题效果。大模型可灵活运用各种策略,小模型需精准匹配任务特点。数学题适合步骤式推理,开放问题需要搜索式方法,效率优先场景宜选简洁策略。研究揭示了AI推理能力的规模门槛效应。
清华大学和理想汽车联合开发的ReflectDrive系统,首次为自动驾驶引入"反省机制",让AI司机具备自我纠错能力。通过将驾驶空间离散化和两阶段路径生成,系统能在规划路径后主动检查安全性,发现问题时智能修正。在NAVSIM基准测试中,该系统综合得分达91.1分,接近人类驾驶水平,为自动驾驶安全性和智能化开辟了新路径。
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
谷歌宣布计划在印度安得拉邦维沙卡帕特南建立AI和数据中心枢纽,这是其在印度的首个AI专用设施。该项目是2026-2030年五年150亿美元投资计划的一部分,将整合大规模计算能力、可再生能源基础设施和扩展的光纤连接。该设施将与AdaniConneX和印度电信公司Airtel合作开发,预计提供"千兆瓦级计算能力"。项目还包括在印度东海岸建设新的海底电缆登陆站,扩大国际连接。
Eightfold联合创始人推出AI数字孪生初创公司Viven,获得3500万美元种子轮融资。该公司通过为每位员工创建专门的大语言模型数字孪生,让团队成员即使在同事不在线时也能获取关键信息。Viven通过访问员工的内部电子文档创建数字孪生,其他员工可查询获得即时答案。公司采用配对上下文和隐私技术确保信息安全共享。
新加坡陆路交通管理局与诺基亚合作,在超过50个地铁站部署光纤局域网解决方案,用于升级视频监控系统。该系统采用硬化光网络单元和光线路终端,支持25Gbps数据传输速度,相比传统铜缆网络减少70%布线和40%功耗。此次部署旨在满足日益增长的容量需求,为数百万日乘客提供实时监控和视频surveillance服务,确保公共安全并协助管理交通模式。
甲骨文将CloudWorld大会更名为AI World,反映企业软件市场从云迁移转向AI内置业务运营。在AI World 2025大会上,甲骨文强调智能体AI从试点项目进入日常ERP和供应链工作流程。Fusion应用内置的AI智能体可处理发票、管理异常、供应商入驻等操作性工作。新推出的AI智能体市场平台允许客户无代码部署经验证的智能体。甲骨文专注于安全、可解释和可审计的AI,在制造、物流、医疗等行业已显示出可衡量的收益。
由黑石、微软、英伟达、xAI和MGX组成的财团以约400亿美元收购Aligned Data Centers,创下数据中心收购纪录。该公司在北美和南美拥有50个数据中心,总容量达5GW。AI基础设施合作伙伴关系计划调动300亿美元股权投资,包含债务融资可达1000亿美元。高盛预测未来两年数据中心容量将激增50%,但警告当前AI投资存在狂热氛围,公司为避免落后而大举借债投资。
谷歌发布Veo 3.1 AI视频生成模型更新,显著改进了提示词遵循能力和图像转视频功能。新版本可同时生成视频和音频,并在Flow视频编辑器中新增"帧到视频"功能,用户可上传首尾帧自动生成中间内容。虽然在真实感方面仍不如OpenAI的Sora 2,但谷歌专注于为专业视频工作者提供实用工具的策略值得认可。
Sholto非常年轻,但他有从Google Gemini团队到Anthropic的经历,让他对大型AI实验室的运作、技术突破的本质、以及行业真实进展有一手认知。
英国科技创新委员会听证会显示,如果没有更多政府支持建设主权量子计算能力,英国可能错失成为该领域领导者的机会。Universal Quantum公司CEO韦特表示,英国拥有科学、人才和创业动力优势,但面临全球竞争。他呼吁政府加快投资速度,建设真正的主权量子能力,包括研发和制造英国制造的量子计算机,避免关键技术流失给外国竞争者。
企业软件公司Infor将亚太地区作为关键增长引擎,凭借制造业软件专长和AI平台能力吸引新客户。CEO表示亚太制造业基础雄厚,是重要市场。公司专注年收入1亿至50亿美元企业,提供行业特定解决方案。通过Leap项目推动客户向云端迁移,与AWS合作解决数据主权问题。在AI方面,Infor开发智能代理功能,结合流程挖掘技术帮助企业识别低效工作流并实现实时自动化改进。
企业软件支出快速增长,在IT预算中占比不断提升,给IT组织带来管理挑战。这一趋势源于对SaaS平台依赖加深、AI等领域软件产品激增。虽然更好的软件采用规则和治理结构有助控制支出,但部署困难。CIO通过减少工具扩张来控制成本,同时提升数据一致性和产品质量。专家建议建立软件资产清单,设立企业目录,并预测未来十年软件可能占IT预算一半以上。
Anthropic发布了Claude Haiku 4.5小型AI语言模型,性能接近五个月前的前沿模型Claude Sonnet 4,但成本降低三分之二,速度提升一倍以上。该模型在SWE-bench编程测试中得分73.3%,与Sonnet 4的72.7%相当。API定价为每百万输入令牌1美元,输出令牌5美元,远低于其他大型模型。新模型专为实时低延迟任务设计,可与Sonnet 4.5协同工作处理复杂编程任务。
DAOS是英特尔Optane时代的并行文件系统产品,现已被英特尔抛弃。Enakta Labs等DAOS基金会成员正在重新激活这一高性能系统。DAOS曾在2023年IO500测试中获得1.3TBps带宽的顶级成绩。作为开源并行文件系统,DAOS需要与Storage Scale、Lustre等成熟产品竞争。Enakta Labs正在商业化DAOS,推出基于其的Enakta数据平台产品,支持S3、SMB、NFS和PyTorch。该公司认为DAOS凭借卓越性能和开源特性,有望在新兴云服务商中获得采用。
思科2025年AI准备度指数显示,尽管86%的企业期望AI在三年内提升员工生产力,但大多数公司在部署AI时缺乏必要的基础设施和明确策略。调查发现,54%的受访者表示其基础设施无法应对AI驱动的工作负载增长,仅15%认为网络具备足够灵活性。更关键的是,只有32%的企业明确了AI代理要执行的人类任务,31%准备好控制和保护AI代理系统。思科警告这种"AI基础设施债务"可能成为业务瓶颈。