人工智能 关键字列表
西湖大学与清华大学联合发布TwinFlow:让AI图像生成秒变魔术,一步搞定原本需要100步的任务

西湖大学与清华大学联合发布TwinFlow:让AI图像生成秒变魔术,一步搞定原本需要100步的任务

西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。

当AI学会分辨真假照片:中山大学团队让图像生成器彻底告别"塑料感"

当AI学会分辨真假照片:中山大学团队让图像生成器彻底告别"塑料感"

中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。

复旦大学团队突破AI视频理解:让机器像侦探一样逐步推理,识别视频中的目标物体

复旦大学团队突破AI视频理解:让机器像侦探一样逐步推理,识别视频中的目标物体

复旦大学团队突破性研究ReVSeg将AI视频理解从简单的物体识别提升到真正的推理分析。该系统采用三步骤分解推理链条:语义理解、时间定位、空间定位,结合强化学习优化推理过程。在多个标准测试中性能提升超过11个百分点,推理过程透明可解释,为自动驾驶、安防监控、医疗诊断等领域开辟新的应用可能。

清华大学突破性成果:从单张照片到活生生的4D世界,如何让静态图像变成会动的立体场景?

清华大学突破性成果:从单张照片到活生生的4D世界,如何让静态图像变成会动的立体场景?

清华大学研究团队开发了MoRe4D系统,能够将单张静态照片转换为可从任意角度观看的4D动态场景。该技术创新性地联合建模几何结构与运动生成,构建了包含6万高质量样本的TrajScene-60K数据集,提出深度感知的运动标准化策略和运动感知模块。实验表明,相比现有方法,MoRe4D在视觉质量、运动合理性和几何一致性方面均有显著提升,为影视制作、教育、虚拟现实等领域带来新的应用可能。

小米等顶尖科研团队联手突破AI训练瓶颈:从模仿到判断,让AI学会像孩子一样成长

小米等顶尖科研团队联手突破AI训练瓶颈:从模仿到判断,让AI学会像孩子一样成长

小米等顶尖科研团队提出CAPO训练方法,通过模仿儿童认知发展规律,将AI训练分为模仿和判断两阶段,解决传统训练中正负信号混合导致的不稳定问题。该方法在数学推理和图形界面操作任务上均获得显著提升,兼容主流算法,为AI训练提供了新思路。

研究人员利用300万天Apple Watch数据训练疾病检测AI

研究人员利用300万天Apple Watch数据训练疾病检测AI

研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。

CoreWeave CEO 为 AI 循环交易辩护称其为"协作共赢"

CoreWeave CEO 为 AI 循环交易辩护称其为"协作共赢"

AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。

IT领导者不可忽视的生成式AI价值实现五大趋势

IT领导者不可忽视的生成式AI价值实现五大趋势

尽管许多组织在生成式人工智能方面投入巨资,但大多数并未获得预期的生产力提升。仅仅采用新技术已不足以推动生产力增长。IT领导者需要帮助员工建立相关技能,提供针对性培训,鼓励员工将AI应用于创意和创新工作。数据显示,每天使用AI的员工获得重大生产力提升的可能性是偶尔使用者的4.6倍。

AI安全监管亟待加强,头部科技公司评分不及格

AI安全监管亟待加强,头部科技公司评分不及格

未来生命研究所最新发布的AI安全指数显示,大型科技公司在AI安全方面表现不佳,最高仅获得C+评级。该指数评估了包括Anthropic、谷歌、Meta、OpenAI等六家主要AI实验室的透明度、技术保障和治理实践。最令人担忧的是,没有一家公司在"存在性安全"类别中获得及格分数,均无法提出可信的超级智能系统控制方案。研究表明AI能力提升速度远超安全保障发展。

TPU挑战GPU霸主地位,谷歌专用芯片崛起

TPU挑战GPU霸主地位,谷歌专用芯片崛起

TPU与GPU之间的竞争正在重塑AI硬件市场格局。GPU基于并行处理,能处理多样化任务,而TPU专门针对张量矩阵运算进行优化。谷歌TPU采用类似RISC的设计理念,通过限制功能来提升特定运算效率。随着Meta计划在2027年采购数十亿美元的TPU芯片,Anthropic宣布使用百万TPU训练Claude模型,TPU生态系统正在获得发展动力,对英伟达的GPU霸主地位构成挑战。

2026年AI预测:自动化发展与工作未来的十大趋势

2026年AI预测:自动化发展与工作未来的十大趋势

本文提出2026年AI发展十大预测,包括AI估值修正、投资泡沫持续、AGI不仅依赖大语言模型、AI代理将加剧工作替代等。作者强调社会接受度对技术发展的重要性,认为成功企业将重构运营模式以AI为核心,同时指出政府仍将重视STEM教育而忽视社会科学的价值。

亚马逊计划2030年前在印度投资350亿美元聚焦AI与物流

亚马逊计划2030年前在印度投资350亿美元聚焦AI与物流

亚马逊宣布将在2030年前向印度投资350亿美元,用于扩展所有业务领域。投资重点包括扩大AI能力和物流网络建设。AWS已在印度运营两个云区域,此前承诺到2030年投资44亿美元。微软也宣布未来四年在印度投资175亿美元发展AI基础设施。亚马逊计划通过该投资推动当地出口从200亿美元增长到800亿美元,并预计到2030年支持380万个就业岗位。

Adobe将Photoshop、Acrobat和Adobe Express集成至ChatGPT

Adobe将Photoshop、Acrobat和Adobe Express集成至ChatGPT

Adobe今日宣布将旗下三款热门应用Photoshop、Adobe Express和Acrobat免费集成到ChatGPT中。用户可通过自然语言指令操作这些软件,如"Photoshop,更换我图片的背景"。此举将为Adobe带来显著的分发优势,因为ChatGPT拥有超过8亿周活跃用户。三款应用已面向全球用户开放,支持多种编辑和PDF处理功能。

Google DeepMind与Apptronik展示家用人形机器人执行真实世界任务

Google DeepMind与Apptronik展示家用人形机器人执行真实世界任务

谷歌DeepMind与Apptronik合作,展示阿波罗人形机器人执行真实家庭任务的能力。机器人可以完成种植盆栽、整理零食和分拣衣物等任务,理解语音指令并处理从未见过的物品。虽然动作缓慢,但展现了语义理解、环境感知和复杂任务推理能力。结合Gemini机器人版本的AI大脑和先进硬件,这代表着通用家庭服务机器人发展的重要进展,尽管在操作精度和速度上仍需改进。

HSD立标杆、生态促普惠,地平线将城区辅助驾驶带入十万级国民市场

HSD立标杆、生态促普惠,地平线将城区辅助驾驶带入十万级国民市场

大会期间,地平线开展智驾体验活动,除了高阶辅助驾驶量产样板间HSD,还携手众多合作伙伴,呈现覆盖不同场景、满足多阶需求的智驾生态全景。

Meta与华盛顿大学联手打造"自我成长"的AI判官:无需人类标注也能精准评判视觉AI表现

Meta与华盛顿大学联手打造"自我成长"的AI判官:无需人类标注也能精准评判视觉AI表现

Meta与华盛顿大学联合研究团队开发出无需人类标注的AI评判官自我训练框架。该方法通过生成合成对比数据、自我判断筛选和反复学习,使110亿参数的AI评判官在多项视觉语言任务中超越GPT-4o等大型模型,成本仅为传统方法的1%,为AI自主学习和评估开辟新路径。

AI终于学会"看"4D世界:华中科技大学团队让机器理解时空中的物体变化

AI终于学会"看"4D世界:华中科技大学团队让机器理解时空中的物体变化

华中科技大学团队开发出4DLangVGGT技术,首次实现AI系统对4D动态场景的语言理解。该技术突破传统方法需要逐场景训练的限制,能跨场景通用部署。系统结合几何感知和语义理解,不仅能识别物体还能描述其时间变化过程。实验显示在多项指标上超越现有方法1-2%,为机器人、AR/VR、智能监控等领域提供重要技术支撑。

微软与西交大联手突破:AI画画不再"糊涂",语义先行让生成速度飞跃100倍

微软与西交大联手突破:AI画画不再"糊涂",语义先行让生成速度飞跃100倍

微软亚洲研究院、西安交通大学和字节跳动联合提出语义优先扩散技术,通过模拟人类绘画"先整体后细节"的认知过程,将AI图像生成分为语义初始化、异步生成和纹理完善三个阶段。该技术在ImageNet数据集上实现了100倍训练加速,FID分数达到1.04的优秀表现,为AI图像生成领域带来重大突破。

小心,AI正在学会用眼睛看世界:厦大团队让机器从单个视频中重建出完整4D世界

小心,AI正在学会用眼睛看世界:厦大团队让机器从单个视频中重建出完整4D世界

厦门大学联合多所顶尖院校开发出DynamicVerse系统,能从普通单目视频中重建出完整的4D世界模型。该系统不仅能恢复真实物理尺度的三维几何结构,还能跟踪动态物体运动并生成详细的多层次文字描述。通过集成多种AI模型和创新的动态束调整技术,在多项基准测试中达到最先进性能,为机器人、AR/VR、内容创作等领域开启了新的应用可能。

AI绘画新突破:香港中文大学DraCo让机器学会"打草稿再完善"的创作方式

AI绘画新突破:香港中文大学DraCo让机器学会"打草稿再完善"的创作方式

香港中文大学研究团队开发的DraCo技术让AI绘画系统学会了"先打草稿再完善"的人类创作方式。通过三步流程:草图生成、错误验证、精准修正,DraCo在多项测试中取得显著提升,特别擅长生成罕见组合和处理复杂要求,为AI创作工具的发展开辟了新方向。