东华师范大学团队提出MLLMSeg框架,仅用34M参数的轻量级模型在图像分割任务中超越了632M参数的传统SAM模型。该方法通过创新的DSFF特征融合模块,充分挖掘多模态大语言模型视觉编码器的潜力,将细节特征与语义特征完美结合,在RefCOCO等标准数据集上取得领先性能,为移动设备部署和实际应用提供了高效解决方案。
中山大学研究团队揭示了大语言模型存在"注意力盆地"现象,即AI在处理多文档时优先关注开头和结尾内容,忽略中间信息。研究发现这种U型注意力分布源于模型对结构边界的特殊偏好。基于此发现,团队开发了注意力驱动重排序方法,通过调整信息位置而非修改模型参数,在十种主流AI模型上实现了显著性能提升,为AI优化提供了全新的"顺势而为"思路。
上海交通大学团队提出SODEC图像压缩技术,突破传统扩散模型压缩速度慢、保真度差的限制。通过单步扩散处理、保真指导模块和比特率退火训练策略,SODEC实现比传统方法38倍的速度提升,同时在图像质量各项指标上超越现有最先进方法,为多媒体应用提供高效解决方案。
Dell PowerProtect以持续创新助力企业提升网络韧性、简化恢复流程,在持续演进的网络威胁环境中筑牢数据安全防线
新加坡国家大学研究团队开发了MACT多智能体协作框架,通过四个专门化AI智能体的分工合作,在文档理解和问答任务上超越了许多大规模单体模型。该系统创新性地采用独立判断智能体进行质量控制,结合混合奖励机制和个性化测试时扩展策略,在15个基准测试中的13个获得最佳表现,为AI协作系统设计提供了新思路。
InfiX.ai和香港理工大学联合发布的InfiAlign框架,通过多维数据筛选和两阶段课程学习,仅用12%训练数据就达到顶级模型性能。该框架发现回答长度与问题难度正相关,创新性地用长度作为难度指标,结合多样性采样和质量过滤,实现了数据效率的巨大提升。在数学推理等任务中表现优异,为资源有限的机构提供了经济高效的AI模型训练方案。
南加州大学和Salesforce联合推出CoAct-1多智能体系统,通过结合传统界面操作与代码执行能力,实现了计算机任务自动化的重大突破。该系统在OSWorld基准测试中达到60.76%的成功率,平均完成任务步数减少至10.15步,显著优于现有方法,为人机交互带来新范式。
阿里巴巴研究团队开发了Marco-Voice多功能语音合成系统,能够同时实现高质量的声音克隆和情感控制。通过创新的旋转情感嵌入和说话人-情感分离技术,系统可以独立调节声音身份和情感表达。团队还构建了包含10小时中文情感语音的CSEMOTIONS数据集。实验表明Marco-Voice在语音清晰度、说话人相似度和情感表达方面都显著超越现有系统,为虚拟助手、内容创作和教育技术等领域提供了强大工具。
华东理工大学团队提出I2CR框架,通过"文字优先、视觉辅助"的多轮反思机制解决多模态实体链接难题。该框架模仿人类认知过程,先用文字信息判断,再通过内部一致性检查和跨模态验证,必要时引入OCR、图像描述等视觉线索进行迭代优化。在三大数据集上准确率分别提升3.2%、5.1%、1.6%,达到业界最佳性能。
腾讯AI西雅图实验室推出的R-Zero框架实现了AI系统从零数据自主学习的突破。该框架通过挑战者和求解者两个角色的协同进化,无需人类标注数据即可显著提升大语言模型的推理能力。在Qwen3-4B模型上,数学推理能力提升6.49分,通用推理能力提升7.54分。这种自进化机制为AI超越人类知识边界提供了新路径。
人工智能芯片初创公司SiMa Technologies宣布其第二代系统级芯片平台MLSoC Modalix正式出货,专为多模态物理AI工作负载设计。该芯片可嵌入机器人、工业设备和车辆等设备中,支持运行大语言模型、卷积神经网络等多种AI算法。芯片采用低功耗设计,能在边缘设备上直接处理传感器数据并运行AI模型,无需依赖云端处理,有效降低延迟。
西雅图AI研究机构Ai2发布MolmoAct 7B,这是首个动作推理模型,能让机器人在执行任务前进行"思考"和规划。该模型可将自然语言指令转化为3D空间中的运动轨迹,通过1800万样本在256个H100芯片上训练完成。在SimPLER基准测试中达到72.1%的任务成功率,超越了谷歌、微软等公司的同类模型。
2009年,比尔·戴利加入英伟达研究实验室时,该实验室仅有约12名员工,专注于计算机图形学中的光线追踪技术。如今这个实验室已发展至400多人,帮助英伟达从90年代的游戏GPU初创公司转型为价值4万亿美元的AI巨头。目前实验室重点开发机器人和AI技术,部分研究成果已应用于产品中。英伟达在周一发布了面向机器人开发者的新AI模型、库和基础设施,展现了从物理AI到机器人领域的技术进展。
代号"Trixie"的Debian 13正式发布,新增64位RISC-V架构支持,同时移除x86-32及MIPS架构支持。新版本升级APT至3.0版本,采用Linux 6.12 LTS内核,使用64位时间戳解决Y2K38问题。安装程序新增Pure Blends预配置包选择,包括面向8岁以下儿童的Debian Junior版本。桌面环境方面包含GNOME 48和复活的LXDE 13,但移除了Hyprland。系统包含超过69,830个软件包,总容量达403GB。
微软VS Code 1.103版本推出GitHub Copilot聊天检查点功能,允许开发者在AI聊天互动出现问题时恢复到之前的状态。新版本还包括MCP服务器工具选择器改进、GPT-5支持、AI使用统计、Git工作树支持等功能。尽管VS Code持续强化AI功能,但根据最新StackOverflow调查显示,仍有76.2%的专业开发者使用VS Code,较去年上升2.2%,远超其他编辑器。
企业面临着通过AI创造价值的巨大压力,但CIO等IT领导者必须考虑技术的伦理使用和风险管理。忽视这一环节将面临信任和公平性问题,甚至严重损失。随着AI法规不断出台,企业面临罚款和诉讼风险。缓解风险需要定义AI伦理框架,确保统一应用。AI伦理应基于公平、透明、问责和隐私四大原则。企业可借鉴现有框架构建治理体系,需要持续审计和更新。成功实施需要C级高管支持和全员参与。
拉各斯、华沙和迪拜等城市成为托管服务增长最快的地区,亚太和欧洲、中东、非洲地区的扩张速度超过传统数据中心热点。Synergy Research数据显示,虽然前十大成熟市场占托管业务41%份额,但其年增长率仅8%,而二三线市场增长率达12%-17%。北弗吉尼亚、北京、上海、伦敦等仍居前十,但新兴市场如华沙、迪拜、拉各斯等增长迅猛。传统热点地区面临电力供应、地产资源限制,推动业务向邻近地区扩散。
英伟达宣布将RTX Pro 6000 Blackwell服务器版GPU引入标准企业服务器,使更多企业能够使用Blackwell技术处理AI和传统工作负载。思科、戴尔、惠普企业、联想等厂商将在其2U企业服务器系统中提供该GPU。新系统采用x86架构、风冷设计,相比仅使用CPU的系统,性能提升45倍,能效提高18倍,可将数百台CPU系统整合为少量RTX Pro服务器。