研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。
尽管许多组织在生成式人工智能方面投入巨资,但大多数并未获得预期的生产力提升。仅仅采用新技术已不足以推动生产力增长。IT领导者需要帮助员工建立相关技能,提供针对性培训,鼓励员工将AI应用于创意和创新工作。数据显示,每天使用AI的员工获得重大生产力提升的可能性是偶尔使用者的4.6倍。
这项由中科院信息工程研究所等机构合作完成的研究,开发出COOPER模型,让AI真正学会了空间推理。通过协调视觉感知和逻辑推理两大能力,COOPER能根据问题类型自主选择是否生成深度图或分割图来辅助分析,在空间理解任务上取得平均6.91%的显著提升,同时保持通用能力不下降。这一突破为AI的协作式智能发展开辟了新道路。
未来生命研究所最新发布的AI安全指数显示,大型科技公司在AI安全方面表现不佳,最高仅获得C+评级。该指数评估了包括Anthropic、谷歌、Meta、OpenAI等六家主要AI实验室的透明度、技术保障和治理实践。最令人担忧的是,没有一家公司在"存在性安全"类别中获得及格分数,均无法提出可信的超级智能系统控制方案。研究表明AI能力提升速度远超安全保障发展。
复旦大学团队突破性研究ReVSeg将AI视频理解从简单的物体识别提升到真正的推理分析。该系统采用三步骤分解推理链条:语义理解、时间定位、空间定位,结合强化学习优化推理过程。在多个标准测试中性能提升超过11个百分点,推理过程透明可解释,为自动驾驶、安防监控、医疗诊断等领域开辟新的应用可能。
TPU与GPU之间的竞争正在重塑AI硬件市场格局。GPU基于并行处理,能处理多样化任务,而TPU专门针对张量矩阵运算进行优化。谷歌TPU采用类似RISC的设计理念,通过限制功能来提升特定运算效率。随着Meta计划在2027年采购数十亿美元的TPU芯片,Anthropic宣布使用百万TPU训练Claude模型,TPU生态系统正在获得发展动力,对英伟达的GPU霸主地位构成挑战。
清华大学研究团队开发了MoRe4D系统,能够将单张静态照片转换为可从任意角度观看的4D动态场景。该技术创新性地联合建模几何结构与运动生成,构建了包含6万高质量样本的TrajScene-60K数据集,提出深度感知的运动标准化策略和运动感知模块。实验表明,相比现有方法,MoRe4D在视觉质量、运动合理性和几何一致性方面均有显著提升,为影视制作、教育、虚拟现实等领域带来新的应用可能。
本文提出2026年AI发展十大预测,包括AI估值修正、投资泡沫持续、AGI不仅依赖大语言模型、AI代理将加剧工作替代等。作者强调社会接受度对技术发展的重要性,认为成功企业将重构运营模式以AI为核心,同时指出政府仍将重视STEM教育而忽视社会科学的价值。
小米等顶尖科研团队提出CAPO训练方法,通过模仿儿童认知发展规律,将AI训练分为模仿和判断两阶段,解决传统训练中正负信号混合导致的不稳定问题。该方法在数学推理和图形界面操作任务上均获得显著提升,兼容主流算法,为AI训练提供了新思路。