这项研究首次系统性地评估了大语言模型在跨数据库系统SQL翻译任务中的能力。研究团队构建了包含598个高质量翻译对的PARROT基准,涵盖22个主流数据库系统。实验结果显示,即使是最先进的AI模型,在SQL翻译任务上的准确率也仅为38.53%,远低于预期。研究识别出三类主要错误模式,并提供了多个评测变体和开源工具。
香港科技大学团队通过DAFNYCOMP基准测试发现,当前最先进的AI模型在编写单个功能时表现优秀(95.67%语法正确率),但在需要多个功能协调工作的复杂程序中却表现糟糕(仅3.69%验证成功率)。研究揭示了AI在组合推理方面的三大缺陷,为理解AI能力边界提供了重要见解。
西班牙国立远程教育大学联合挪威国家图书馆创建BOE-XSUM数据集,包含3648个西班牙法律文档的极简摘要,旨在将复杂法律条文转换为普通人可理解的语言。研究显示专门训练的小型模型在此任务上超越大型通用模型,为西班牙语自然语言处理和法律信息民主化提供重要突破,有望大幅提升法律透明度。
阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统,通过绕过传统电网升级时间线,使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运,将作为响应电网的动态资产,在需求高峰期放电,增强区域电网可靠性。这标志着美国首次使用专用电池系统加速大型数据中心并网。
微软在Edge浏览器中推出增强版Copilot模式,提供更强大的AI代理功能,目前在美国进行限量预览。该模式包含Actions和Journeys两大功能:Actions让浏览器能代表用户执行任务,如语音控制打开网页或查找文章特定内容;Journeys则记住用户浏览历史,帮助用户继续之前的研究任务。此举正值AI浏览器竞争加剧,OpenAI推出ChatGPT Atlas、Perplexity发布Comet、谷歌集成Gemini到Chrome。目前Chrome占据71%市场份额,Edge仅占4.67%。
IBM正通过收购红帽和HashiCorp、为Power和z系统增加AI功能等方式,构建盈利能力强的AI产品服务组合。公司拥有超10万企业客户,将为其提供安全、熟悉的AI集成解决方案。IBM第三季度营收163.3亿美元,同比增长9.1%,净利润17.4亿美元。基础设施业务受益于Power11和z17升级周期,销售额增长17%。GenAI咨询订单增加15亿美元,占咨询积压订单的22%。
MIT媒体实验室推出可扩展AI智能网络演进项目(SAIpien),专注于可审计的人机交互系统。该项目将负责任AI从政策讨论转化为工程学科,连接用户体验标准与可追溯的治理机制。通过数字孪生、原型开发和跨领域设计,SAIpien为医院、城市和企业提供可检查、可适应的AI决策系统,填补了AI治理与实际部署之间的关键空白。
随着机器学习和大语言模型在企业中的广泛应用,AI系统的数据来源和使用方式日益受到关注。企业开始为客户提供详细的伦理评分卡,记录模型训练数据的来源、处理方式和使用情况。这些评分卡帮助组织建立客户信任,确保合规性并降低法律风险。评分卡涵盖数据溯源、可解释性、模型局限性、潜在偏见和隐私保护等关键要素,成为AI产品选择和监管合规的重要工具。
亚马逊旗下直播平台Twitch在TwitchCon 2025大会上发布多项AI功能。其中Auto Clip功能可帮助主播快速剪辑多小时直播中的精彩片段,便于分享到TikTok等短视频平台。平台还将集成Meta的AI智能眼镜,支持直接通过眼镜进行直播。尽管AI工具成本高昂,但Twitch认为这能帮助75%不制作剪辑的主播提升内容创作效率,扩大粉丝群体。
SAP公布全年云收入位于指导区间下限,令投资者失望。高管表示制造业和公共部门客户签约周期延长。该欧洲软件巨头预计销售额将接近216-219亿欧元预测区间的下限,股价下跌2%。第三季度全球收入91亿欧元,同比增长7%,云收入增长22%至52.9亿欧元,低于分析师预期。CEO表示对第四季度交易回升持乐观态度。
阿联酋正经历数字基础设施转型,数据中心和云投资浪潮将该国重塑为人工智能和数字化转型的区域枢纽。据研究报告,阿联酋数据中心市场2024年价值约12.6亿美元,预计2030年将超过33亿美元。政府数字化议程、AI技术快速采用和鼓励创新的监管环境共同推动投资激增。阿里巴巴云等全球科技巨头加大在阿联酋投资,本土企业Khazna数据中心计划到2030年新增超过1GW超大规模容量。
谷歌宣布在量子计算研究中取得重大突破,其量子回声算法运算速度比顶级经典超级计算机快13000倍。该算法在Willow量子芯片上运行,已成功计算分子结构,为药物发现等实际应用铺平道路。研究显示量子增强核磁共振技术可成为药物发现的强大工具,这是历史上首次量子计算机成功运行超越超级计算机能力的可验证算法。
生成式AI快速发展带来巨大机遇,但也面临海量数据管理挑战。Gartner预测到2029年,键值对象存储将占本地非结构化数据50%,生成式AI存储需求将超2EB。传统存储系统在性能、扩展性和元数据管理方面存在瓶颈,无法满足AI工作流需求。HPE Alletra Storage MP X10000提供智能数据服务、卓越性能和无缝扩展能力,通过内联元数据丰富、模型上下文协议等创新技术,加速RAG管道和推理周期,帮助企业充分释放AI潜力。
2025 年第二季度,雷鸟创新以高达 39% 的市场份额,登顶全球 AR 眼镜市场第一,并且超越了苹果,成为了全球 XR 市场(含 VR 头显和 AR 眼镜)第三。
北京大学研究团队开发出基于RRAM芯片的高精度模拟矩阵计算系统,通过将低精度模拟运算与迭代优化结合,突破了模拟计算的精度瓶颈。该系统在大规模MIMO通信测试中仅需2-3次迭代就达到数字处理器性能,吞吐量和能效分别提升10倍和3-5倍,为后摩尔时代计算架构提供了新方向。
谷歌宣布已将约3万个生产软件包移植到Arm架构,计划全面转换以便在自研Axion芯片和x86处理器上运行工作负载。YouTube、Gmail和BigQuery等服务已在x86和Axion Arm CPU上运行。谷歌开发了名为CogniPort的AI工具协助迁移,成功率约30%。公司声称Axion服务器相比x86实例具有65%的性价比优势和60%的能效提升。
要成功进行"氛围编程",关键是了解所使用的生成式AI或大语言模型的编程个性。不同AI模型生成的代码风格迥异,有的精准简洁,有的冗长混乱。研究显示,当前主流LLM在代码生成方面各有特点,但普遍存在安全漏洞和工程规范不足等问题。用户需要认识到AI生成的代码往往不完整、包含错误,仍需人工审查和完善。
在AI热潮高峰期,承诺与现实之间的差距仍然巨大。新一波平台正将AI转化为普通人可实际使用的工具。分析师预计AI即服务市场将从2024年的160亿美元激增至2030年的1050亿美元,年增长率约36%。下一阶段AI竞争将聚焦于可用性而非模型智能程度。小企业现在可以在几分钟内构建自动化客户入门或文案机器人,无需编写代码。AI正经历类似Shopify的时刻,将机器智能从奢侈品转变为实用工具。
研究显示AI正在重塑IT行业,初级软件工程职位下降近20%,失业率上升。虽然AI自动化了重复性任务,但企业仍需有经验的专业人士监督系统。CIO需要重新定义职业发展路径,从传统阶梯式转向网格式结构,重点培养批判性思维、情商和沟通等软技能,将初级员工培养为AI代理管理者,确保人才发展与技术进步同步。
IROS 2025四足机器人挑战赛中,来自曼彻斯特大学的ZsiMan高校战队使用智身科技钢镚L1机器狗平台首次参赛,即夺得冠军。