最新文章
斯坦福大学团队打造医学AI"超级图书管理员":580万问答对让人工智能看病更靠谱

斯坦福大学团队打造医学AI"超级图书管理员":580万问答对让人工智能看病更靠谱

斯坦福大学等机构研究团队创建了MIRIAD医学问答数据库,包含582万对基于权威医学文献的结构化问答。该系统通过多层质量控制确保准确性,在医学AI问答任务中将准确率提升6.7%,在检测医学错误信息方面提升22.5%-37%。研究还开发了交互式可视化平台MIRIAD-Atlas,让用户能够直观探索医学知识结构,为医学AI的安全可靠部署提供了重要资源。

给AI"投喂"高质量数据:如何让机器像人类一样看懂世界?

这项研究创建了包含10,610张高质量摄影图片的DSD数据集,每张图片都配有三层人工标注和精确分割。通过对比实验证明,使用高质量数据训练的AI视觉模型在图像理解和描述能力上显著优于传统方法,其中LLAVA-NEXT模型性能提升达24%,验证了"数据为王"的AI发展新范式。

斯坦福大学新发现:AI竟然能像人类一样"边玩边学",彻底改变机器学习方式

斯坦福大学新发现:AI竟然能像人类一样"边玩边学",彻底改变机器学习方式

斯坦福大学人工智能实验室开发出革命性的"好奇心驱动"AI学习系统,让机器能够像人类一样通过主动探索来学习复杂技能。该技术通过内在动机机制,使AI学习效率提升十倍,并能够发现创新解决方案,在机器人导航、医疗诊断、自动驾驶等领域展现巨大应用潜力,为实现更智能、更自然的人机交互奠定基础。

2025-06-11

英特尔携手合作伙伴打造高效智算底座,加速企业AI应用落地

今日,在火山引擎2025春季原动力大会上,英特尔联合火山引擎共同发布搭载英特尔(R) 至强(R) 6性能核处理器的第四代通用计算型(ECS)实例家族,即全新推出的通用计算基础型实例 g4i、算力增强型实例 g4ie,并深入展示了此前发布的I/O增强型实例 g4il的丰富用例。

火山引擎发布豆包1.6,Agent规模化关键破题

火山引擎发布豆包1.6,Agent规模化关键破题

在2025火山引擎春季FORCE原动力大会上,豆包大模型1.6正式发布,支持256k长上下文。包含 Doubao-Seed-1.6-thinking、Doubao-Seed-1.6 All-in-One、Doubao-Seed-1.6-flash。

引领园区网效率革命:新华三正式发布全光网络5.0解决方案

近日,紫光股份旗下新华三集团面向全球正式发布全光网络5.0解决方案,并在GITEX Europe柏林展重磅亮相。

第三方安全漏洞威胁欧洲大型银行

第三方安全漏洞威胁欧洲大型银行

研究显示,欧洲最大金融机构中近96%的公司在过去一年内曾受到第三方安全突破,比两年前上升25%,突显出供应链中深藏的网络风险,迫切需要从被动防御向主动防护转变。

日常药物发现:技术如何拓展临床试验的潜力并重新聚焦参与者

日常药物发现:技术如何拓展临床试验的潜力并重新聚焦参与者

本文探讨如何运用 eCOA、eConsent 及传感器等技术实现临床试验以患者为中心,降低参与门槛、优化流程并提升数据质量。

Apple 宣布 2025 年设计大奖获奖名单

Apple 宣布 2025 年设计大奖获奖名单

在WWDC2025举办前夕,Apple公布了2025年度设计奖的获奖者和入围者,重点展示开发者如何借助其工具打造出卓越的应用体验。本届评选在欢愉、创新、交互、包容性、社会影响及视觉图形六个类别中各评一款应用和游戏,共计12个获奖项目。值得注意的是,尽管部分应用具备AI功能,但生成式AI应用却未入选。

优步为老年人推出全新账户类型,提供更简洁的用户界面

优步为老年人推出全新账户类型,提供更简洁的用户界面

Uber 推出针对老年用户的专用账号,优化应用界面(大字体、简化图标)并支持家庭共乘与医保卡支付,美国率先上线,未来全球推广。

当大模型开始"看错字":复旦等多校联合破解AI视觉幻觉难题

当大模型开始"看错字":复旦等多校联合破解AI视觉幻觉难题

这项由复旦、港科大等多校联合完成的研究首次系统性地解决了大型AI模型在识别场景文字时产生"语义幻觉"的问题。研究团队发现AI模型常将视觉上模糊的文字"脑补"成有意义但错误的词汇,并开发了包含ZoomText定位策略和接地层修正机制的训练无关解决方案,在多个基准测试中实现显著性能提升,为提高AI视觉系统可靠性提供了重要突破。

IBM研究院发布业界首个工业资产智能代理评估平台:AI如何像熟练工程师一样管理复杂设备

IBM研究院发布业界首个工业资产智能代理评估平台:AI如何像熟练工程师一样管理复杂设备

IBM研究院发布AssetOpsBench,全球首个工业资产AI代理评估平台。该研究建立了多代理协作框架,涵盖IoT数据采集、时序分析、故障诊断等专业模块,通过141个真实场景和六维评估标准测试AI在复杂工业运维中的表现。测试显示当前AI技术仍有改进空间,为工业4.0时代的智能运维发展提供重要基准。

KAIST团队巧妙"瘦身"让AI模型跑得更快更聪明——像高速公路一样的神奇架构

KAIST团队巧妙"瘦身"让AI模型跑得更快更聪明——像高速公路一样的神奇架构

韩国科学技术院研究团队开发出Simba方法,通过层次化稀疏化技术对状态空间模型进行"瘦身",在保持性能的同时显著提升计算效率。该方法采用类似高速公路的架构设计,让AI模型的上层只处理最重要的信息,实现了最高80%的速度提升和更好的长序列处理能力。这项即插即用的技术为AI模型优化提供了新思路。

以色列团队推出"哨兵":AI世界的超级保安,专治恶意提示词攻击

以色列团队推出"哨兵":AI世界的超级保安,专治恶意提示词攻击

这项研究展示了一个基于ModernBERT架构的prompt injection检测模型,通过精心构建的多样化数据集训练,在内部测试中达到98.7%准确率和98.0% F1分数,在公开基准测试中平均F1分数达93.8%,显著超越现有最强基线系统。该模型推理速度仅0.02秒,具备实时检测能力,为AI系统安全防护提供了新的解决方案。

清华等顶尖高校发现:AI越聪明,人类越糊涂?首个大规模研究揭示人机协作的隐秘真相

清华等顶尖高校发现:AI越聪明,人类越糊涂?首个大规模研究揭示人机协作的隐秘真相

这是首个大规模研究AI知识传授能力的实验,涉及118名参与者与8个顶级AI模型的协作。研究发现AI的智能水平与教学效果并非正比关系,一些高性能AI反而在协作中表现不佳。通过分析数千条对话记录,研究揭示了影响人机协作成功的关键因素,包括表达方式匹配、自适应引导和避免过度依赖。研究警示:随着AI能力提升,可能出现"知识传授鸿沟",需要专门优化AI的可理解性。

字节跳动竟然开发出"程序评分机器人":一套神奇的算法系统让编程比赛测试题生成变得像玩游戏一样简单

字节跳动竟然开发出"程序评分机器人":一套神奇的算法系统让编程比赛测试题生成变得像玩游戏一样简单

字节跳动研究团队开发出革命性的"生成器-验证器"AI系统,专门解决编程竞赛中测试用例质量低下的问题。通过172万份真实数据验证,新系统生成的测试用例准确率比现有方案提高一倍,创建了全新的CodeContests+数据集。这项工作为AI编程能力评估和训练提供了更可靠的基础设施。

Cisco 推出数据中心解决方案 助力 AI

Cisco 推出数据中心解决方案 助力 AI

思科发布全新硬件、网络及安全方案,包括 AI Canvas 和统一 Nexus Dashboard,通过整合计算、网络与安全能力,全面提升 AI 基础设施效能。

OpenAI 发布 o3-pro:升级版 o3 AI 推理模型

OpenAI 发布 o3-pro:升级版 o3 AI 推理模型

OpenAI 推出 o3-pro,它采用分步推理技术提升在物理、数学和编程等领域的表现,支持网页搜索、文件分析、视觉推理及 Python 应用。该模型相比旧版本响应稍慢,但在多项评测中全面超越竞争对手。

高通分享其内置生成式 AI 的智能眼镜未来愿景

高通分享其内置生成式 AI 的智能眼镜未来愿景

文章概述了高通在 AWE 展会现场展示了一次全新演示,利用搭载 Snapdragon AR1+ Gen 1 处理器的智能眼镜直接在设备上运行生成式 AI,无需手机或云端支持,从而预示 XR 设备的全新发展方向。