斯坦福大学等机构研究团队创建了MIRIAD医学问答数据库,包含582万对基于权威医学文献的结构化问答。该系统通过多层质量控制确保准确性,在医学AI问答任务中将准确率提升6.7%,在检测医学错误信息方面提升22.5%-37%。研究还开发了交互式可视化平台MIRIAD-Atlas,让用户能够直观探索医学知识结构,为医学AI的安全可靠部署提供了重要资源。
这项研究创建了包含10,610张高质量摄影图片的DSD数据集,每张图片都配有三层人工标注和精确分割。通过对比实验证明,使用高质量数据训练的AI视觉模型在图像理解和描述能力上显著优于传统方法,其中LLAVA-NEXT模型性能提升达24%,验证了"数据为王"的AI发展新范式。
斯坦福大学人工智能实验室开发出革命性的"好奇心驱动"AI学习系统,让机器能够像人类一样通过主动探索来学习复杂技能。该技术通过内在动机机制,使AI学习效率提升十倍,并能够发现创新解决方案,在机器人导航、医疗诊断、自动驾驶等领域展现巨大应用潜力,为实现更智能、更自然的人机交互奠定基础。
今日,在火山引擎2025春季原动力大会上,英特尔联合火山引擎共同发布搭载英特尔(R) 至强(R) 6性能核处理器的第四代通用计算型(ECS)实例家族,即全新推出的通用计算基础型实例 g4i、算力增强型实例 g4ie,并深入展示了此前发布的I/O增强型实例 g4il的丰富用例。
在2025火山引擎春季FORCE原动力大会上,豆包大模型1.6正式发布,支持256k长上下文。包含 Doubao-Seed-1.6-thinking、Doubao-Seed-1.6 All-in-One、Doubao-Seed-1.6-flash。
近日,紫光股份旗下新华三集团面向全球正式发布全光网络5.0解决方案,并在GITEX Europe柏林展重磅亮相。
研究显示,欧洲最大金融机构中近96%的公司在过去一年内曾受到第三方安全突破,比两年前上升25%,突显出供应链中深藏的网络风险,迫切需要从被动防御向主动防护转变。
本文探讨如何运用 eCOA、eConsent 及传感器等技术实现临床试验以患者为中心,降低参与门槛、优化流程并提升数据质量。
在WWDC2025举办前夕,Apple公布了2025年度设计奖的获奖者和入围者,重点展示开发者如何借助其工具打造出卓越的应用体验。本届评选在欢愉、创新、交互、包容性、社会影响及视觉图形六个类别中各评一款应用和游戏,共计12个获奖项目。值得注意的是,尽管部分应用具备AI功能,但生成式AI应用却未入选。
Uber 推出针对老年用户的专用账号,优化应用界面(大字体、简化图标)并支持家庭共乘与医保卡支付,美国率先上线,未来全球推广。
这项由复旦、港科大等多校联合完成的研究首次系统性地解决了大型AI模型在识别场景文字时产生"语义幻觉"的问题。研究团队发现AI模型常将视觉上模糊的文字"脑补"成有意义但错误的词汇,并开发了包含ZoomText定位策略和接地层修正机制的训练无关解决方案,在多个基准测试中实现显著性能提升,为提高AI视觉系统可靠性提供了重要突破。
IBM研究院发布AssetOpsBench,全球首个工业资产AI代理评估平台。该研究建立了多代理协作框架,涵盖IoT数据采集、时序分析、故障诊断等专业模块,通过141个真实场景和六维评估标准测试AI在复杂工业运维中的表现。测试显示当前AI技术仍有改进空间,为工业4.0时代的智能运维发展提供重要基准。
韩国科学技术院研究团队开发出Simba方法,通过层次化稀疏化技术对状态空间模型进行"瘦身",在保持性能的同时显著提升计算效率。该方法采用类似高速公路的架构设计,让AI模型的上层只处理最重要的信息,实现了最高80%的速度提升和更好的长序列处理能力。这项即插即用的技术为AI模型优化提供了新思路。
这项研究展示了一个基于ModernBERT架构的prompt injection检测模型,通过精心构建的多样化数据集训练,在内部测试中达到98.7%准确率和98.0% F1分数,在公开基准测试中平均F1分数达93.8%,显著超越现有最强基线系统。该模型推理速度仅0.02秒,具备实时检测能力,为AI系统安全防护提供了新的解决方案。
这是首个大规模研究AI知识传授能力的实验,涉及118名参与者与8个顶级AI模型的协作。研究发现AI的智能水平与教学效果并非正比关系,一些高性能AI反而在协作中表现不佳。通过分析数千条对话记录,研究揭示了影响人机协作成功的关键因素,包括表达方式匹配、自适应引导和避免过度依赖。研究警示:随着AI能力提升,可能出现"知识传授鸿沟",需要专门优化AI的可理解性。
字节跳动研究团队开发出革命性的"生成器-验证器"AI系统,专门解决编程竞赛中测试用例质量低下的问题。通过172万份真实数据验证,新系统生成的测试用例准确率比现有方案提高一倍,创建了全新的CodeContests+数据集。这项工作为AI编程能力评估和训练提供了更可靠的基础设施。
思科发布全新硬件、网络及安全方案,包括 AI Canvas 和统一 Nexus Dashboard,通过整合计算、网络与安全能力,全面提升 AI 基础设施效能。
OpenAI 推出 o3-pro,它采用分步推理技术提升在物理、数学和编程等领域的表现,支持网页搜索、文件分析、视觉推理及 Python 应用。该模型相比旧版本响应稍慢,但在多项评测中全面超越竞争对手。
文章概述了高通在 AWE 展会现场展示了一次全新演示,利用搭载 Snapdragon AR1+ Gen 1 处理器的智能眼镜直接在设备上运行生成式 AI,无需手机或云端支持,从而预示 XR 设备的全新发展方向。