AMD首席执行官苏姿丰在纽约金融分析师日活动中表示,公司已准备好迎接AI浪潮并获得传统企业计算市场更多份额。AMD预计未来3-5年数据中心AI收入复合年增长率将超过80%,服务器CPU收入份额超过50%。公司2025年预期收入约340亿美元,其中数据中心业务160亿美元。MI400系列GPU采用2纳米工艺,Helios机架系统将提供强劲算力支持。
德国铁电存储公司FMC获得1亿欧元C轮融资,用于将FERAM芯片技术应用于AI数据中心,替代DRAM和SRAM。FERAM具有与DRAM和SRAM相似的速度,但具备非易失性特征且耗电更少。公司推出DRAM+和3D CACHE+两款产品,旨在解决AI技术栈中的内存瓶颈问题。该技术采用标准CMOS工艺制造,但面临供应链接受度的挑战。
本文探讨了AI在垂直市场中的应用前景。垂直市场指专门服务特定行业客户的细分市场,如医疗或金融行业。专家认为,生成式AI首次实现了知识工作的真正自动化,在医疗、金融、法律等高成本知识密集型领域具有显著ROI潜力。成功的垂直AI应用需要拥有客户工作流程,采用基于价值而非按席位的定价模式,并将AI从工具逐步发展为团队合作伙伴。
谷歌宣布将在未来两年内向德州投资400亿美元,用于建设三个新数据中心以支持云计算和人工智能业务。新建设施将分布在阿姆斯特朗县和哈斯克尔县。这是谷歌在美国任何州的最大投资,将使其在德州的总投资达到427亿美元。此前谷歌已在该州建有两个数据中心。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。
香港大学研究团队提出LightReasoner框架,通过让小型"业余"模型与大型"专家"模型对比,识别关键推理步骤并转化为训练信号。该方法在数学推理任务上实现28.1%性能提升,同时将训练时间、样本需求和词元使用量分别减少90%、80%和99%,完全无需人工标注。研究颠覆了传统训练思路,证明通过模型间行为差异可以实现高效的自监督学习,为资源受限环境下的AI能力提升提供了新路径。
马里兰大学研究团队开发了MONKEY适配器,一种无需额外训练的AI绘画控制技术。该方法通过"两步走"策略解决了个性化AI绘画中主体保真与背景控制难以兼得的问题:先让AI识别主体区域生成"透明胶片",再在第二次生成中让主体区域听从参考图片、背景区域听从文字描述。实验证明该方法在保持主体特征和响应文字要求两方面均表现出色,为AI绘画的精细化控制提供了新思路。
上海交通大学研究团队首创Hybrid-depth技术,巧妙融合CLIP和DINO两大视觉基础模型,用语言引导方式解决单目深度估计难题。该技术采用"粗到精"学习框架,通过语言作为不同模型间的"翻译官",让计算机能像人眼一样准确判断物体距离。实验显示性能显著超越现有方法,在自动驾驶等应用中展现广阔前景。
巴黎萨克雷大学研究团队开发了一套创新方法,能够像侦探破案一样从个人文字叙述中解码心理特征。他们将AI技术与语言学理论结合,分析了数百份梦境记录,特别研究了一位越战老兵的案例,发现其语言模式反映了创伤对心理表达的深刻影响。这项技术为心理诊断治疗、教育个性化和消费者行为分析等领域开辟了广阔应用前景。
莫斯科研究团队开发出ELMUR技术,突破性地解决了机器人记忆能力有限的根本问题。该技术为机器人配备智能记忆管理系统,记忆范围延长十万倍,在百万步迷宫测试中达到100%成功率。通过层级记忆、双向交互和智能更新机制,ELMUR让机器人首次具备类人长期记忆能力,为家庭服务、医疗护理、工业制造等领域应用奠定基础,标志着机器人智能向认知式转变的重要突破。
MAUM.AI团队开发的D2E系统成功实现了用游戏数据训练机器人的突破。该系统通过OWA工具包收集1300多小时游戏操作数据,利用通用逆向动力学模型从YouTube视频中自动生成训练样本,最终通过VAPT技术将虚拟技能转移到真实机器人上,在操作任务达到96.6%成功率,导航任务达到83.3%成功率,大幅降低了机器人训练成本。
谢里夫大学团队首次提出"复杂度分布外泛化"框架,重新定义AI推理能力评估标准。研究发现现有AI更像刷题高手而非真正思考者,提出通过处理超出训练复杂度问题的能力来衡量真正智能。该框架统一了学习与推理概念,指出需要从评估方法、训练范式到架构设计的全面革新,为构建下一代通用人工智能提供了清晰路径。
KAIST团队首次实现使用68.74%合成数据成功训练108亿参数的韩英双语AI模型KORMo-10B,打破了传统认为大量合成数据会导致模型崩溃的观念。该研究采用多源合成数据生成和完全开源策略,在26个测试基准上达到与传统模型相当性能,为小语种AI发展和数据稀缺问题提供了突破性解决方案。
图宾根大学AI中心研究团队提出DISCO方法,通过选择能引起模型分歧的关键样本和直接的模型签名预测,将AI模型评估成本降低99%以上。该方法在MMLU等主流测试中表现优异,仅用100个样本就能达到传统方法使用数万样本的准确度,为AI研究提供了更高效、更经济的评估解决方案。
MIT等顶尖研究机构联合发现,当前AI安全监控系统存在致命漏洞,攻击者仅需在输出中嵌入特殊文字就能轻松欺骗监控器,让恶意行为被标记为"完全安全"。研究在两大AI安全平台测试了多种先进监控器,发现所有系统都无法抵御这种简单攻击,甚至某些"改进版"协议反而让攻击更容易成功,揭示了AI安全架构的根本性脆弱。
在2025年KubeCon/CloudNativeCon北美大会上,云原生开发社区正努力超越AI炒作,理性应对人工智能带来的风险与机遇。随着开发者和运营人员广泛使用AI工具构建AI驱动的应用功能,平台工程迎来复兴。CNCF推出Kubernetes AI认证合规程序,为AI工作负载在Kubernetes上的部署设定开放标准。会议展示了网络基础设施层优化、AI辅助开发安全性提升以及AI SRE改善可观测性工作流等创新成果。
DeepL作为欧洲AI领域的代表企业,正将业务拓展至翻译之外,推出面向企业的AI代理DeepL Agent。CEO库蒂洛夫斯基认为,虽然在日常翻译场景面临更多竞争,但在关键业务级别的企业翻译需求中,DeepL凭借高精度、质量控制和合规性仍具优势。他对欧盟AI法案表示担忧,认为过度监管可能阻碍创新,使欧洲在全球AI竞争中落后。
本文介绍了提示工程领域的新技术"协作提示",该技术能让AI从传统的单轮快速回答模式转向多轮协作对话模式。文章提供了短版和长版两种协作提示模板,解释了AI通常不具备协作性的原因,并通过实例对比展示了协作提示的效果。研究表明,这种方法能够帮助用户获得更深入、更实质性的AI回答,特别适用于复杂问题的探索和解决。
全球信用评级巨头Experian正经历125年来最大转型,从传统信用局向分析和软件提供商转变。公司35%收入现来自软件平台业务。通过与AWS的10年云服务协议,Experian构建了超过100PB的数据湖,开发了Ascend AI平台,将模型部署时间从三周缩短至2-3天。在欺诈检测领域,AI驱动的系统比传统规则系统检测率提升37-45%。公司还利用大语言模型自动化监管合规报告生成,大幅减少人工工作量。