2025年,人工智能进入智能体时代,AI不再只是分析数据或生成文本,而是能够代表用户执行实际操作。AI智能体可以预订旅行、管理预算、处理保险理赔等,但这种自主性也带来了巨大风险。与传统软件不同,智能体在动态环境中运作,行为难以预测。目前的测试方法无法应对复杂的现实场景,急需新的验证层来持续监控和验证智能体行为,确保其安全可靠地运行。
诺基亚在谷歌云市场推出三项网络API服务:按需服务质量、号码验证和设备位置验证。开发者可通过这些API接入多个移动网络,创建新应用程序。诺基亚的Network as Code平台为开发者提供标准化网络功能访问,无需了解底层网络技术。该生态系统包含全球45个以上合作伙伴,旨在通过API将可编程网络资产与开发者生态系统连接,为消费者、企业和工业客户创造新用例。
数据中心正面临电力供应限制阻碍其增长的时期。戴尔奥罗集团研究显示,2025年第一季度数据中心物理基础设施市场同比增长17%,这是连续第四个季度实现两位数增长。AI工作负载推动液冷技术收入翻倍,高密度功率机架接近600千瓦。美国能源部报告称,数据中心2023年消耗美国总电力的4.4%,预计2028年将达到6.7-12%。全球数据中心电力消耗约占总电力3%,到2030年可能翻倍。
CIO们指出,技术变革步伐加快带来了众多新兴技术,但许多技术并未兑现预期效益。生成式AI连续第三年上榜,智能体AI因成本高昂和商业价值不明被过度炒作。数字员工、AIOps、量子计算等技术的现实能力仍落后于期望。元宇宙、AR/VR等空间计算技术采用缓慢,多云策略在互操作性方面存在挑战。
Testin 云测凭借旗下 Testin XAgent 智能座舱 AI 智能化测试系统,与百度 Apollo、阿里云、科大讯飞等科技企业一同入选。值得一提的是,Testin 云测是本次获选名单中唯一的 AI 测试服务商,这无疑是行业对其在汽车智能服务领域 AI 测试技术领先性与应用创新性的高度认可。
在今日开幕的2025年全球闪存峰会上,Solidigm亚太区销售副总裁倪锦峰在主题演讲中,详细介绍了Solidigm的创新之道——高性能存储如何在性能、容量和能耗上呈现出适合AI时代存力需求的“新范式”。
世界数字科学院(WDTA)在联合国日内瓦总部正式发布AI STR系列新标准《AI智能体运行安全测试标准》。
随着数字化时代的到来,网络安全威胁呈指数级增长。勒索软件、AI驱动的网络攻击和物联网设备漏洞成为主要威胁。企业需要建立全面的风险管理策略,包括风险评估、安全措施实施和持续监控。新兴技术如人工智能、区块链和量子计算为网络安全带来新机遇。组织应重视员工培训、供应链安全、数据治理和事件响应能力建设。
AWS Amazon Bedrock负责人Atul Deo正致力于让人工智能软件变得更便宜和更智能。他在12月re:Invent大会前只有六个月时间来证明这一目标的可行性。Deo表示AI领域发展速度前所未有,模型每几周就会改进,但客户只有在经济效益合理时才会部署。为此,AWS推出了提示缓存、智能路由、批处理模式等功能来降低推理成本,同时开发能执行多步骤任务的自主代理软件,将AI应用从聊天机器人转向实际业务流程自动化。
滑铁卢大学研究团队开发出ScholarCopilot,一个革命性的AI学术写作助手。该系统突破传统"先检索后生成"模式,实现写作过程中的动态文献检索和精确引用。基于50万篇arXiv论文训练,引用准确率达40.1%,大幅超越现有方法。在人类专家评估中,引用质量获100%好评,整体表现优于ChatGPT。这项创新为AI辅助学术写作开辟新道路。
哥伦比亚大学研究团队发布NodeRAG技术,通过异构图结构革新智能问答系统。该方法将文档信息分解为7种节点类型,采用双重搜索机制,在多个权威测试中准确率达89.5%,检索效率提升50%以上,为智能信息检索技术带来重大突破。
KRAFTON研究团队提出T1方法,让小型AI模型通过借助代码解释器等外部工具进行自我验证,解决了小模型记忆力有限导致的验证准确性问题。实验显示,10亿参数的模型配合T1方法在数学推理任务上能够超越80亿参数的独立模型,为小型AI模型的高效部署开辟了新路径。
香港大学推出TokenHSI系统,通过创新的"任务符号化"策略实现虚拟角色多技能统一控制。该系统能让虚拟角色像真人一样灵活完成坐立、搬运、攀爬等复杂任务组合,相比传统方法在技能组合任务中成功率从26.8%提升至99.2%,为游戏、动画、VR等领域带来革命性进展。
微软研究院开发的MineWorld是首个开源实时交互式游戏AI世界模型,专门针对Minecraft设计。该系统使用创新的并行解码算法,实现每秒4-7帧的超快生成速度,能够跟上职业电竞选手的操作节奏。系统不仅能生成高质量游戏画面,更重要的是真正理解玩家操作含义,甚至具备自主游戏能力。研究团队设计了全新的评测体系来衡量AI的理解能力,并将所有代码开源,为游戏AI领域树立了新标杆。
清华大学研究团队开发出VideoScene技术,能够仅从两张普通照片一步生成完整3D场景视频,速度比传统方法快50倍。该技术巧妙结合了3D重建与视频生成,采用"3D感知跨越流蒸馏"策略和"动态去噪策略网络",在多项评估指标上显著超越现有方法。这项突破为VR/AR、游戏开发、电商展示等领域带来革命性应用前景,标志着从"大量数据依赖"向"智能有限数据利用"的重要转变。
蒙纳什大学等机构联合开发的VLIPP框架首次让AI视频生成真正"懂"物理定律。该系统通过视觉语言模型预测物理运动轨迹,再由视频扩散模型生成高质量画面,在两大权威基准测试中全面超越现有方法,为影视制作、教育等领域带来革命性突破。
阿里巴巴团队提出UniME框架,通过两阶段训练方法突破传统多模态AI的局限性。该技术采用文本知识蒸馏和困难负样本训练,显著提升了模型在图文理解、检索和组合概念处理方面的能力,在多个基准测试中取得3-10%的性能提升,为未来智能搜索和多媒体理解应用奠定了重要基础。
中国AI初创公司月之暗面发布开源语言模型Kimi K2,采用万亿参数混合专家架构,在编程和自主代理任务上表现卓越。该模型在SWE-bench等关键基准测试中超越GPT-4,同时提供免费开源版本和低价API服务。Kimi K2具备强大的"代理"能力,能自主使用工具、编写代码并完成复杂多步骤任务,标志着开源AI模型首次在综合能力上追平甚至超越闭源竞品,可能重塑AI行业竞争格局。