最新文章
视频AI学会看懂动作:MIT和NVIDIA研究团队让机器像人类一样理解运动

视频AI学会看懂动作:MIT和NVIDIA研究团队让机器像人类一样理解运动

这项由MIT领导的多机构合作研究首次实现了视频运动的全自动标注技术。研究团队开发的FoundationMotion系统能够自动识别、追踪和描述视频中的物体运动,生成了包含46.7万个视频片段的大规模数据集。经过训练的AI模型在运动理解任务上取得显著提升,甚至在某些领域超越了大型闭源模型,为自动驾驶、机器人和视频分析等应用提供了重要技术支撑。

伊利诺伊大学团队重磅突破:AI终于学会了像人类一样"思考"着创造3D世界

伊利诺伊大学团队重磅突破:AI终于学会了像人类一样"思考"着创造3D世界

伊利诺伊大学团队开发的CoRe3D系统实现了AI在3D理解和创造领域的重大突破。该系统创新性地结合了语义推理和几何推理两套"思维方式",能够理解复杂文字描述并生成相应的高质量3D物体。系统采用透明的推理过程,在所有评价指标上都超越现有技术,并能处理传统AI无法理解的抽象描述,为教育、设计、娱乐等多个领域带来广阔应用前景。

西湖大学团队大胆颠覆大模型训练教条:先模仿再探索竟比"边模仿边探索"效果更佳

西湖大学团队大胆颠覆大模型训练教条:先模仿再探索竟比"边模仿边探索"效果更佳

西湖大学联合华为诺亚方舟实验室发布重磅研究,通过90万样本大规模实验颠覆AI训练常识。研究发现"先模仿后探索"的顺序训练优于主流的同步训练方式,能达到更高性能天花板。团队提出"可塑性-天花板"理论框架,发现数据规模是性能主要决定因素,验证损失可预测最终效果,为AI训练提供科学指导原则。

佳明自动驾驶系统成功实现小型飞机无人干预自动着陆

佳明自动驾驶系统成功实现小型飞机无人干预自动着陆

Garmin紧急自动降落系统在科罗拉多州洛基山都会机场成功完成首次实际应急使用,一架比奇超级空中国王飞机在遭遇增压问题后,由自动化系统完全引导安全降落。该系统能在飞行员无法操控时接管飞机控制权并自动降落。飞行员在舱内高度超过安全水平时主动启用该系统,整个过程完全按设计运行,最终飞机安全着陆。

手术室调度混乱每天浪费数小时,AI如何成为医院救星

手术室调度混乱每天浪费数小时,AI如何成为医院救星

医疗AI和机器人备受关注,但真正让医院损失资金的问题是手术室协调。每天有2-4小时手术室时间被浪费,原因不是手术本身,而是人工调度、协调混乱和房间周转猜测等中间环节。Akara联合创始人兼CEO Conor McGinn分享了公司如何从清洁机器人转向环境感知,利用热传感器和AI构建医院"空中交通管制系统"。他还讨论了NHS审查如何成为进入美国医院的后门,以及40%护理人员可能在五年内离职对自动化的影响。

英国AI公司Nscale斥资8.65亿美元加码美国数据中心布局

英国AI公司Nscale斥资8.65亿美元加码美国数据中心布局

英国AI基础设施公司Nscale将投资8.65亿美元,与WhiteFiber签署10年期40兆瓦托管协议,租用其位于北卡罗来纳州麦迪逊市的NC-1数据中心。该设施占地96英亩,建筑面积100万平方英尺,WhiteFiber已投资1.5亿美元建设。Nscale将从2026年4月开始使用20兆瓦容量,次月再增加20兆瓦。今年9月,Nscale完成11亿美元B轮融资以支持全球扩张。

Salesforce集成ChatGPT主要为防止客户数据泄露

Salesforce集成ChatGPT主要为防止客户数据泄露

Salesforce用户现在可以通过Agentforce和ChatGPT Enterprise直接在聊天机器人中更新CRM数据。这一集成主要是为了防止用户自建集成方案导致数据泄露到公司控制范围之外。分析师指出,此举实际上是出于安全考虑,旨在阻止用户使用模型上下文协议自建MCP服务器,避免Salesforce数据暴露给各种大语言模型,确保数据在公司治理和使用监控范围内。

英伟达斥资200亿美元许可芯片初创公司Groq技术

英伟达斥资200亿美元许可芯片初创公司Groq技术

人工智能芯片初创公司Groq宣布英伟达将获得其技术的非独占授权,交易价值200亿美元。英伟达还将雇佣Groq的关键员工,包括创始人兼首席执行官Jonathan Ross。此次反向收购避免了反垄断审查。Groq的LPU推理芯片能耗比显卡低十倍,采用确定性设计和片上SRAM内存。英伟达计划将Groq的低延迟处理器集成到AI工厂架构中。

EcoStruxure(TM) Building GPT楼宇智能运维专家
2025-12-25

EcoStruxure(TM) Building GPT楼宇智能运维专家

技术引领奖-模型枢纽奖

普渡大学研究团队突破性成果:让AI从随意摆放的物品中学会空间布局的秘密

普渡大学研究团队突破性成果:让AI从随意摆放的物品中学会空间布局的秘密

普渡大学和英伟达研究院合作开发的I-Scene系统,首次实现了让AI从完全随机的物体组合中学会空间布局规律。该系统通过"重新编程"现有3D物体生成模型,添加场景上下文注意力机制,并采用视角中心空间表示,成功将单体模型转化为场景级空间推理器。实验证明,即使在无语义意义的随机场景中训练,系统也能掌握支撑、遮挡等基础空间关系,在多项指标上显著超越现有方法。

M-A-P团队首次实现:从一首歌自动生成完整MV!音乐视频制作迎来AI革命

M-A-P团队首次实现:从一首歌自动生成完整MV!音乐视频制作迎来AI革命

M-A-P团队开发的AutoMV系统首次实现从单首歌曲自动生成完整音乐视频,采用多智能体协作模式,包含音乐分析、智能编剧、视觉导演和质量审核等模块。在30首测试歌曲上,AutoMV在音乐内容相关性和技术质量方面显著超越商业竞品,制作成本仅10-20美元,耗时30分钟,大幅降低了MV制作门槛,为音乐创意产业带来革命性变化。

UCLA携手Salesforce新突破:智能手机也能拥有"预知未来"的能力

UCLA携手Salesforce新突破:智能手机也能拥有"预知未来"的能力

UCLA联合Salesforce开发出革命性"语义世界模型",让AI助手首次具备预知手机操作结果的能力。研究团队创建了包含140万样本的MobileWorld数据集和MobileWorldBench评估系统,通过让AI用自然语言描述状态变化而非预测像素细节,实现了7.4%的任务成功率提升,为智能助手技术开辟了全新发展路径。

内华达大学发现四款AI"解锁"工具的秘密:哪一款最靠谱?

内华达大学发现四款AI"解锁"工具的秘密:哪一款最靠谱?

内华达大学研究团队对四款AI"解锁"工具进行了全面评测,测试了它们在16个不同AI模型上的表现。研究发现Heretic工具兼容性最强,DECCP速度最快,ErisForge对AI能力损害最小。特别值得注意的是,数学推理能力在解锁过程中最容易受损,某些情况下成绩下降超过26%。这项研究为合法AI研究提供了工具选择指南,同时揭示了现有AI安全机制的脆弱性。

NVIDIA团队破解AI语言模型速度密码:让机器"说话"快5倍的革命性方法

NVIDIA团队破解AI语言模型速度密码:让机器"说话"快5倍的革命性方法

NVIDIA联合多所知名大学提出Efficient-DLM技术,成功解决了扩散语言模型速度慢的关键问题。通过创新的块状注意力机制和位置相关掩码策略,实现了在保持模型准确性的同时大幅提升生成速度的突破,为AI应用的实用化发展开辟了新路径。

Sakana AI的语言模型新突破:让AI像人类一样重新整理思路

Sakana AI的语言模型新突破:让AI像人类一样重新整理思路

这项由日本Sakana AI完成的研究提出了REPO方法,让大语言模型首次具备了类似人类的信息重组能力。通过动态调整词汇位置而非固定编码,REPO在噪音文本处理中提升11个百分点,长文本任务中提升超13个百分点,同时保持普通任务性能不变,为AI智能文本理解开辟了新路径。

北航团队打造医学影像修复"万能钥匙":一个模型搞定所有任务

北航团队打造医学影像修复"万能钥匙":一个模型搞定所有任务

北京航空航天大学研究团队开发出任务自适应变换器TAT,这是首个能同时高效处理PET合成、CT去噪和MRI超分辨率三种医学影像修复任务的"万能"系统。通过创新的任务自适应权重生成和损失平衡策略,TAT解决了多任务学习中的任务干扰和任务失衡问题,在保持通用性的同时达到专用系统的性能水平,为医学影像AI技术的临床应用开辟了新路径。

机器人学会"边做边学":新加坡国立大学让AI机器人像人类一样从实践中进步

机器人学会"边做边学":新加坡国立大学让AI机器人像人类一样从实践中进步

新加坡国立大学研究团队开发的EVOLVE-VLA框架让机器人实现了"边做边学"的能力,突破了传统训练需要数百示范的限制。该框架通过累积式进度评估和渐进式任务扩展策略,让机器人能够在实际操作中持续改进技能,在长期任务中成功率提升8.6%,在单示范条件下提升17.7%,并首次实现了零示范跨任务学习能力,为通用机器人智能发展指明了方向。

UC圣芭芭拉分校联手亚马逊推出LikeBench:首个评估AI助手"讨人喜欢"能力的全新基准测试

UC圣芭芭拉分校联手亚马逊推出LikeBench:首个评估AI助手"讨人喜欢"能力的全新基准测试

UC圣芭芭拉分校与亚马逊联合推出LikeBench,这是首个专门评估AI助手"讨人喜欢"能力的测试平台。研究发现,AI的记忆能力与用户喜爱程度并不直接相关,GPT-5在综合表现中最受欢迎。该系统通过七个维度评估AI的交流质量,揭示了当前AI在长期交互中的局限性,为开发更人性化的AI助手提供了重要指导。

北大团队提出CAP方法:让AI在混淆的语境中也能准确判断用户真实意图

北大团队提出CAP方法:让AI在混淆的语境中也能准确判断用户真实意图

北京大学团队针对小型语言模型在相似语义分类中的混淆问题,提出了类感知归因先验(CAP)方法。该方法通过向大型语言模型提供完整任务指令和标签信息,结合巧妙的词汇遮盖实验,能够精确识别不同类别间的关键区分特征。实验显示,CAP方法在处理语义相近的分类任务时准确率提升显著,为构建更可靠的AI系统提供了新思路。

机器人长了"透明皮肤"还能同时看能摸,北京大学团队让机器人操作精度提升54%

机器人长了"透明皮肤"还能同时看能摸,北京大学团队让机器人操作精度提升54%

北京大学团队开发出TacThru透明触觉传感器,让机器人首次实现真正的同时视觉-触觉感知。通过透明弹性材料和创新的关键线标记设计,解决了传统传感器只能"看"或"摸"的局限。配合TacThru-UMI学习系统,机器人操作成功率达85.5%,比纯视觉方案提升54%,能够处理纸巾抽取、精密装配等复杂任务。