最新文章
突破性空间推理技术:伊利诺伊大学研究团队开发出让AI"看懂"空间关系的新方法

突破性空间推理技术:伊利诺伊大学研究团队开发出让AI"看懂"空间关系的新方法

这项由伊利诺伊大学香槟分校研究团队开发的突破性AI技术,首次让机器具备了类似人类的空间推理能力。通过创新的细粒度偏好优化训练方法,SpatialReasoner-R1不仅能准确判断图片中的空间关系,还能提供完整的逻辑推理过程。在空间质量和数量任务上分别实现4.1%和9.0%的性能提升,为自动驾驶、机器人导航、增强现实等领域带来重要应用前景。

噪声一致性训练:让AI绘画工具一步到位的香港科技大学新突破

噪声一致性训练:让AI绘画工具一步到位的香港科技大学新突破

香港科技大学团队提出噪声一致性训练(NCT),这是首个专为一步生成器设计的原生控制添加方法。NCT通过在噪声空间进行一致性训练和边界约束,无需重新训练基础模型即可为预训练的一步生成器添加新的控制能力。实验显示该方法在保持生成质量的同时将速度提升50倍,在多种控制任务上超越传统方法,为AI图像生成的实用化提供了重要突破。

南开大学团队推出LLaVA-Scissor:让AI视频理解快如闪电的"语义剪刀"技术

南开大学团队推出LLaVA-Scissor:让AI视频理解快如闪电的"语义剪刀"技术

南开大学团队开发的LLaVA-Scissor技术通过创新的"语义连通组件"算法,实现了视频AI理解的高效压缩。该技术采用两步时空压缩策略,在保持99.7%准确率的同时将计算量减半,为解决视频AI系统计算瓶颈提供了突破性方案。

伊利诺伊大学新突破:让AI像搭积木一样改变照片中的物体位置

伊利诺伊大学新突破:让AI像搭积木一样改变照片中的物体位置

伊利诺伊大学研究团队开发出"生成式积木世界"系统,通过将照片分解成3D几何积木,让用户能够直观地编辑图像中物体的位置、大小和角度,同时保持原有质感。该技术突破了传统图像编辑在3D空间操作上的限制,为专业设计和普通用户提供了全新的创作工具。

NewsBreak团队推出DuaShepherd:让AI数学推理更聪明的双重奖励系统

NewsBreak团队推出DuaShepherd:让AI数学推理更聪明的双重奖励系统

NewsBreak团队与伊利诺伊大学合作开发DuaShepherd,这是一个创新的AI数学推理奖励模型。该系统独创性地结合了两种评估维度:步骤正确性判断和解题潜力评估,通过多任务学习和复合概率融合,在MATH500和ProcessBench测试中显著超越传统单一奖励模型,为AI数学推理提供了新的技术路径。

YouTube移动视频编辑器即将登陆iOS平台

YouTube移动视频编辑器即将登陆iOS平台

谷歌正准备将YouTube Create视频编辑应用带到iOS设备,距离该应用在Android平台独家发布已近两年。招聘信息显示,谷歌正在印度积极招聘工程师开发iOS版本。尽管YouTube Create提供免费移动视频编辑工具,但在与ByteDance的剪映和InShot的竞争中明显落后。数据显示,剪映第二季度Android下载量达6600万次,而YouTube Create仅不到50万次。

伊利诺伊大学团队突破传统动画技术:让虚拟角色拥有真实的物理身体

伊利诺伊大学团队突破传统动画技术:让虚拟角色拥有真实的物理身体

伊利诺伊大学团队开发了PhysRig系统,突破传统角色动画技术局限。该系统通过嵌入真实物理原理,将虚拟角色建模为具有弹性材料特性的立体结构,解决了传统线性混合蒙皮技术中的体积变形、不自然弯曲等问题。研究创新性地提出材料原型概念,大幅降低参数学习复杂度,在多项评估中显著优于传统方法,为动画制作、游戏开发和虚拟现实应用提供了更真实的角色动画解决方案。

从童画到动画:让孩子涂鸦"活"起来的神奇技术——大湾区大学突破性研究成果

从童画到动画:让孩子涂鸦"活"起来的神奇技术——大湾区大学突破性研究成果

大湾区大学研究团队开发的FairyGen系统能够将儿童简笔画转换为完整动画故事。该系统通过智能故事规划、风格传播适配器和3D重建技术,让画中角色"活"起来并保持原画艺术风格。采用两阶段训练策略分离身份与运动学习,实现自然流畅的动画效果,为创意教育和个性化内容创作开辟新途径。

Databahn认为你的SIEM数据大多被浪费了——AI来拯救

Databahn认为你的SIEM数据大多被浪费了——AI来拯救

总部位于达拉斯的初创公司Databahn成立于2023年,专注于通过AI智能体分析大量日志遥测数据来诊断安全威胁。该公司开发了Cruz AI智能体,可自动化处理日志发现、数据规范化、转换优化等流程。公司推出Reef产品来摄取PB级日志数据,实时过滤和优先处理高价值数据。近期获得1700万美元A轮融资,总融资额达1900万美元,将用于开发自主智能体和全球扩张。

新一代采购平台Levelpath获得5500万美元融资

新一代采购平台Levelpath获得5500万美元融资

采购软件初创公司Levelpath完成5500万美元B轮融资,由Battery Ventures领投。该公司由Scout RFP创始人Stan Garber和Alex Yakubovich创立,后者曾以5.4亿美元被Workday收购。Levelpath打造移动优先的用户友好平台,并从创立之初就集成AI能力,可审查合同中的非结构化数据并推荐更便宜的类似产品服务。目前客户包括Ace Hardware、安进等知名企业。

未来办公室长什么样?惠普给出了一个AI时代的答案
2025-07-01

未来办公室长什么样?惠普给出了一个AI时代的答案

从“战AI智能体”到本地私有部署,惠普在中国全面推进商用AI PC落地,为千行百业打造真正可用的AI体验。

里通义开源音频生成模型,能模仿音效师为视频配音
2025-07-01

里通义开源音频生成模型,能模仿音效师为视频配音

通义实验室已推出语音生成大模型 Cosyvoice、端到端音频多模态大模型MinMo等模型,全面覆盖语音合成、音频生成、音频理解等场景。

中国移动团队携手Zero Gravity实验室:让千亿参数大模型在"蜗牛网速"下飞跃训练

中国移动团队携手Zero Gravity实验室:让千亿参数大模型在"蜗牛网速"下飞跃训练

这项由中国移动和Zero Gravity实验室合作的研究成功突破了大模型训练的网络带宽限制,首次实现在1Gbps网络下训练1070亿参数模型,速度比传统方法快357倍。通过流水线并行、延迟重叠机制和自适应压缩算法的创新组合,为分布式AI训练开辟了新可能。

Yandex发布MADrive:让自动驾驶在虚拟世界学会应对真实危险

Yandex发布MADrive:让自动驾驶在虚拟世界学会应对真实危险

这项研究介绍了MADrive系统,一种革命性的自动驾驶场景模拟技术。该系统通过一个包含7万辆真实车辆的数据库,能够将普通驾驶录像转换成各种危险场景的高逼真度模拟,为自动驾驶系统提供安全的训练环境。实验表明,相比传统方法,MADrive在多个关键性能指标上都有显著提升,为解决自动驾驶训练数据稀缺问题提供了新思路。

微软亚洲研究院发布HeurAgenix:让AI自己学会解决超级难题的全新框架

微软亚洲研究院发布HeurAgenix:让AI自己学会解决超级难题的全新框架

微软亚洲研究院发布HeurAgenix框架,首次实现让大型语言模型自动进化和选择算法来解决组合优化难题。该系统通过对比学习机制让AI自主发现改进策略,并开发轻量级选择模型在保持性能的同时大幅降低成本。在五大经典问题测试中表现卓越,为传统需要专家手工设计的优化问题提供了自动化解决方案。

布里斯托大学提出:AI变身"聪明的偷懒专家",让Transformer模型学会跳过中间层

布里斯托大学提出:AI变身"聪明的偷懒专家",让Transformer模型学会跳过中间层

布里斯托大学研究团队提出了一种创新的Transformer架构,让AI模型学会根据任务复杂度动态跳过中间冗余层。该技术通过门控机制和智能注意力系统,允许简单任务走"快速通道"以提高效率。虽然在当前实验规模下未达到预期性能提升,但为大规模AI模型的效率优化提供了新思路和技术基础。

2025-07-01

美光突破 PC 性能边界,推出自适应写入技术与 G9 QLC NAND

SSD 对于提升 PC 及客户端设备的用户体验和系统性能至关重要。Micron Technology Inc.今日宣布,推出美光 2600 NVMe(TM) SSD,专为原始设备制造商(OEM)设计的高性价比客户端存储解决方案。

Catio荣获VB Transform 2025"最酷技术"大奖

Catio荣获VB Transform 2025"最酷技术"大奖

帕洛阿尔托创业公司Catio在VentureBeat Transform 2025大会上获得"最酷技术"奖。该公司成立于2023年,已筹集700万美元资金。Catio推出的AI技术架构副驾驶将架构重新定义为可编码、可内省和智能演进的活体系统。通过结合实时架构地图和多智能体AI组织,帮助工程团队从被动决策转向持续主动的架构优化,为CTO和架构师提供数据驱动的架构决策支持。

生成超1000万份志愿报告,夸克实现国内最大规模深度研究应用

生成超1000万份志愿报告,夸克实现国内最大规模深度研究应用

“志愿报告”是今年夸克针对志愿填报推出的核心功能,也是国内唯一可以生成完整志愿报告的Agent。

谷歌推出教育版Gemini工具全面进军智能化课堂

谷歌推出教育版Gemini工具全面进军智能化课堂

谷歌在ISTE教育技术大会上发布超过30款AI教育工具,包括专为教育打造的Gemini应用、协作视频制作工具Google Vids扩展访问权限等。教师可利用AI技术进行头脑风暴、生成教案、个性化学习内容,还能创建定制版Gemini"助手"为学生提供额外支持。新工具还包括AI阅读伙伴、学习进度追踪、Chrome设备管理等功能,旨在通过"负责任的AI"推动个性化学习体验。