复旦大学联合多所知名院校开发了GeometryZero模型,通过创新的群体对比策略优化(GCPO)方法,让小尺寸AI模型具备了类似数学专家的几何推理能力。该模型能智能判断何时使用辅助构造工具,在多个几何基准测试中表现优异,为AI教育应用的普及化奠定了基础,展现了专门化训练的巨大潜力。
特拉维夫大学研究团队发现AI在思考时具备类似人类的"进度感知"能力,并开发出"超频"技术让AI思考更高效。通过提取AI内部的"思考进度向量",不仅能实时显示AI的思考进展,还能主动调节思考速度。实验显示该技术在数学推理任务中将AI思考时间缩短30%的同时提升了答题准确率,为AI的可解释性和效率优化开辟了新方向。
华南理工大学研究团队构建了迄今最大的中文字符识别数据集MegaHan97K,包含97,455个汉字类别和超过460万个样本,是此前最大数据集的六倍。该数据集首次完全支持最新的GB18030-2022中文标准,通过手写、历史文献和合成三个子集有效解决了长尾分布问题。实验表明,使用该数据集训练的模型性能显著提升,为古籍数字化保护和现代中文处理应用提供了强大技术支撑。
武汉大学团队开发了EVOREFUSE系统,通过进化算法生成能触发AI过度拒绝的伪恶意指令。研究发现AI存在"捷径学习"问题,过度关注敏感词汇而忽略语境。团队创建的测试数据集在9个模型上的触发率比现有最佳方案高140%,训练数据集可使模型过度拒绝减少40%同时保持安全性。该研究为AI安全测试和训练提供了新工具和理论洞察。
中科院团队首次开发出1比特视觉-语言-动作模型BitVLA,实现机器人智能操作的革命性突破。该模型将每个参数限制为{-1,0,1}三值表示,通过创新的蒸馏感知训练策略,在仅使用29.8%内存的情况下达到与先进模型相当的性能。在LIBERO机器人基准测试中表现优异,为智能机器人在资源受限设备上的部署开辟了新路径,让家用机器人成为可能。
新加坡科技大学研究团队发现小型AI语言模型存在"长思维链退化"现象:当用少量复杂推理样本训练时,模型性能反而大幅下降。研究显示用8000个样本训练的小模型准确率可降75%,但大规模训练(12万+样本)配合强化学习能实现显著提升。研究首次系统阐释了错误累积机制,为小型AI模型训练策略提供重要指导,颠覆了"少量高质量数据即可改善小模型"的传统认知。
这项来自南洋理工大学和商汤科技的开创性研究,首次系统性地为GUI自动化AI赋予了人类般的自我反思和错误纠正能力。通过创新的三阶段训练框架和自动化数据生成技术,成功让AI学会了识别错误、撤销操作和从失败中学习,在复杂任务上的成功率提升了138%。这一突破不仅推动了GUI自动化技术的发展,更为构建真正智能的AI系统提供了新的范式。
斯坦福大学等机构研究团队创建了MIRIAD医学问答数据库,包含582万对基于权威医学文献的结构化问答。该系统通过多层质量控制确保准确性,在医学AI问答任务中将准确率提升6.7%,在检测医学错误信息方面提升22.5%-37%。研究还开发了交互式可视化平台MIRIAD-Atlas,让用户能够直观探索医学知识结构,为医学AI的安全可靠部署提供了重要资源。
这项研究创建了包含10,610张高质量摄影图片的DSD数据集,每张图片都配有三层人工标注和精确分割。通过对比实验证明,使用高质量数据训练的AI视觉模型在图像理解和描述能力上显著优于传统方法,其中LLAVA-NEXT模型性能提升达24%,验证了"数据为王"的AI发展新范式。
斯坦福大学人工智能实验室开发出革命性的"好奇心驱动"AI学习系统,让机器能够像人类一样通过主动探索来学习复杂技能。该技术通过内在动机机制,使AI学习效率提升十倍,并能够发现创新解决方案,在机器人导航、医疗诊断、自动驾驶等领域展现巨大应用潜力,为实现更智能、更自然的人机交互奠定基础。
今日,在火山引擎2025春季原动力大会上,英特尔联合火山引擎共同发布搭载英特尔(R) 至强(R) 6性能核处理器的第四代通用计算型(ECS)实例家族,即全新推出的通用计算基础型实例 g4i、算力增强型实例 g4ie,并深入展示了此前发布的I/O增强型实例 g4il的丰富用例。
在2025火山引擎春季FORCE原动力大会上,豆包大模型1.6正式发布,支持256k长上下文。包含 Doubao-Seed-1.6-thinking、Doubao-Seed-1.6 All-in-One、Doubao-Seed-1.6-flash。
近日,紫光股份旗下新华三集团面向全球正式发布全光网络5.0解决方案,并在GITEX Europe柏林展重磅亮相。
研究显示,欧洲最大金融机构中近96%的公司在过去一年内曾受到第三方安全突破,比两年前上升25%,突显出供应链中深藏的网络风险,迫切需要从被动防御向主动防护转变。
本文探讨如何运用 eCOA、eConsent 及传感器等技术实现临床试验以患者为中心,降低参与门槛、优化流程并提升数据质量。
在WWDC2025举办前夕,Apple公布了2025年度设计奖的获奖者和入围者,重点展示开发者如何借助其工具打造出卓越的应用体验。本届评选在欢愉、创新、交互、包容性、社会影响及视觉图形六个类别中各评一款应用和游戏,共计12个获奖项目。值得注意的是,尽管部分应用具备AI功能,但生成式AI应用却未入选。
Uber 推出针对老年用户的专用账号,优化应用界面(大字体、简化图标)并支持家庭共乘与医保卡支付,美国率先上线,未来全球推广。
这项由复旦、港科大等多校联合完成的研究首次系统性地解决了大型AI模型在识别场景文字时产生"语义幻觉"的问题。研究团队发现AI模型常将视觉上模糊的文字"脑补"成有意义但错误的词汇,并开发了包含ZoomText定位策略和接地层修正机制的训练无关解决方案,在多个基准测试中实现显著性能提升,为提高AI视觉系统可靠性提供了重要突破。
IBM研究院发布AssetOpsBench,全球首个工业资产AI代理评估平台。该研究建立了多代理协作框架,涵盖IoT数据采集、时序分析、故障诊断等专业模块,通过141个真实场景和六维评估标准测试AI在复杂工业运维中的表现。测试显示当前AI技术仍有改进空间,为工业4.0时代的智能运维发展提供重要基准。