Sunswift赛车队在即将到来的普利司通世界太阳能挑战赛前,在赛车和支援车辆上部署了爱立信智能链路绑定技术。该赛事将于2025年8月24-31日举行,路线全长3000公里,从达尔文到阿德莱德。爱立信的智能链路绑定技术将结合蜂窝、卫星和有线等多个广域网链路,为车队提供实时遥测数据收集、视频直播和通信支持,确保在极具挑战性的赛事环境中保持不间断连接。
旧金山AI研究初创公司Deep Cogito发布四款新的大语言模型,参数规模从700亿到6710亿不等。这些模型采用混合推理系统设计,能够学习更有效的推理方式并自我改进。通过迭代蒸馏放大技术,模型将推理过程内化到训练中,发展出"机器直觉",使用比同类模型短60%的推理链条就能达到相似性能。模型在数学、法律推理和多跳问题等任务中表现出色,训练成本仅350万美元。
AWS推出Amazon DocumentDB Serverless正式版,为MongoDB兼容的文档数据库带来自动扩缩容功能。该服务专门针对智能体AI工作负载的不可预测需求模式,通过按需计费模式,相比传统预置数据库可降低高达90%的成本。无服务器架构消除了容量规划需求,自动匹配实际使用量,特别适合AI智能体的突发性资源消耗模式,为企业AI应用提供更灵活高效的数据库基础设施。
从4万亿芯片帝国到AI革命,黄仁勋揭秘英伟达30年创新密码:'你必须相信你所相信的'。当计算成本10年下降10万倍,人类将面临怎样的未来?这场斯坦福对话给出了颠覆性答案。
香港中文大学团队首次将DeepSeek-R1推理范式应用到视频理解,开发出Video-R1系统。该系统通过创新的T-GRPO训练方法,让AI学会利用视频时序信息进行深度推理,而非简单识别画面。在多项测试中表现优异,甚至在空间推理任务上超越GPT-4o,为AI视频理解开辟新道路。
上海AI实验室发布视觉强化微调技术,让计算机学会"边看边思考"。该方法通过强化学习训练视觉模型先进行推理再给出答案,在少样本学习中表现优异,单样本图像分类准确率提升24.3%,物体检测精度提升超20分,在开放词汇检测等任务上也实现显著突破。
这项由北京大学主导、联合多家国际顶尖机构完成的研究,首次系统性地梳理了大语言模型智能体领域的完整技术图谱。研究提出了"构建-协作-进化"的统一框架,深入分析了智能体的技术架构、应用场景和发展挑战,为理解这一前沿技术提供了重要指南,对推动AI智能体技术的健康发展具有重要意义。
以色列理工学院研究团队开发了AdaptiVocab技术,通过为大语言模型定制专业领域词汇表来提升AI效率。该方法将常见专业词汇组合(如"量子力学")整合为单个处理单元,减少了25%以上的计算步骤,同时保持文本生成质量不变。这种"精工定制"思路为AI优化提供了新方向,有望显著降低专业领域AI应用的运营成本。
Rice大学研究团队发布的这篇综述论文系统分析了大型语言模型推理效率问题。研究发现AI在回答简单问题时经常"过度思考",生成冗长推理过程,增加成本和延迟。论文将解决方案分为三类:优化训练方法、动态调整推理过程、改进用户提示词,为开发更高效的AI推理系统提供了全面指导。
新加坡国立大学ShowLab团队提出FAR模型,通过"长短期上下文建模"和多级缓存系统,解决了AI视频生成中的长期记忆问题。该模型能生成长达300帧的连贯视频,在多个基准测试中达到最优性能,为AI世界模拟器的发展奠定重要基础。
这项由莫斯科人工智能研究院完成的研究证明了AI可以通过智能特征选择在保持性能的同时大幅提高效率。研究团队开发了基于自编码器和Gumbel-Softmax的特征筛选方法,在文字识别任务中即使删除50%视觉特征也能维持近似性能,为多模态AI系统的效率优化提供了新思路。
康奈尔科技学院研究团队开发出突破性的"块扩散"AI语言模型,巧妙结合自回归和扩散模型优势,实现了既快速又准确的文本生成。该技术支持任意长度文本创作,生成速度显著提升,在标准测试中创下扩散模型新纪录,为AI写作助手和对话系统开辟了新的发展路径。
自 2018 年以来,AWS DeepRacer 已吸引全球超过 56 万名开发者参与,充分印证了开发者可以通过竞技实现能力成长的实践路径。如今,亚马逊云科技将通过亚马逊云科技AI联赛,将这一模式继续拓展至生成式 AI 时代。
在软件定义世界的今天,AI 与软件工程的融合正重塑测试行业格局。中国人工智能产业发展联盟发布的《AI4SE 行业现状调查报告(2024 年度)》显示,65.75% 的企业软件研发智能化成熟度已达 L2 及以上水平,标志着 AI 技术在软件工程领域从概念验证迈向规模化落地。
施耐德电气携EcoStruxure(TM) Building GPT亮相WAIC 2025。
以“数智世界 津门有为”为主题的“华为中国行2025·天津新质生产力城市峰会”成功举办。
阿联酋穆罕默德·本·扎耶德人工智能大学研究团队开发出轻量级语音合成系统LLMVoX,仅用3000万参数就能让任何大语言模型获得流式语音输出能力。该系统实现475毫秒超低延迟,词错误率仅3.7%,支持多语言扩展,可与视觉语言模型集成,为AI语音交互提供了"即插即用"的革命性解决方案。
谷歌DeepMind发布AlphaEarth Foundations AI模型,能处理每日数TB卫星数据追踪地表变化。该模型如"虚拟卫星"般将全球陆地和沿海水域映射为数字表示,帮助科学家监测食品安全、森林砍伐、城市扩张等关键问题。模型整合光学卫星图像、雷达、激光测绘等数据源,以10×10米精度追踪变化,错误率比其他模型低24%。
ChatGPT虽然是目前最受欢迎的AI聊天机器人,但它并非万能。文章指出11个不应该使用ChatGPT的场景:诊断健康问题、处理心理健康、紧急安全决策、个人财务税务规划、处理机密数据、违法行为、学术作弊、监控实时信息、赌博预测、起草法律文件以及创作艺术。AI可能产生错误信息、缺乏实时数据更新,在高风险场景下可能造成严重后果。用户应了解其局限性,在关键决策时寻求专业帮助。