最新文章
2025-06-10

爱簿智能推出E300 AI计算模组:50TOPS国产算力,赋能边缘AI全场景高效部署

国产可控边缘AI基座来了!爱簿E300 AI计算模组以50TOPS国产算力护航关键场景,可实现32B大模型本地轻量化部署!

从愿景到现实 聚焦生成式AI全球实践 2025亚马逊云科技中国峰会将于6月19日在上海开幕

2025亚马逊云科技中国峰会将于6月19日-20日在上海世博中心举行。本届峰会将汇聚来自亚马逊云科技纽约、伦敦、巴黎等峰会的全球云计算与AI领域权威专家以立足国际的先锋视角,解读生成式AI在全球范围内的落地实践等前沿趋势。

当AI遇上癌症诊断:上海交大团队如何让机器"看懂"细胞的秘密

当AI遇上癌症诊断:上海交大团队如何让机器"看懂"细胞的秘密

上海交通大学研究团队开发出革命性AI癌症诊断系统,通过深度学习技术分析50万张细胞图像,实现94.2%的诊断准确率,诊断时间从30分钟缩短至2分钟。该系统不仅能识别多种癌症类型,还具备解释性功能,已在多家医院试点应用。研究成果发表于《Nature Communications》,展示了AI在精准医疗领域的巨大潜力。

机器人学会3D"变身术":南华理工大学让机器人像人类一样理解物体运动

机器人学会3D"变身术":南华理工大学让机器人像人类一样理解物体运动

南华理工大学等机构提出3DFlowAction方法,让机器人通过预测物体3D运动轨迹来学习操作技能。该研究创建了包含11万个实例的ManiFlow-110k数据集,构建了能预测三维光流的世界模型,实现了跨机器人平台的技能迁移。在四个复杂操作任务上成功率达70%,无需特定硬件训练即可在不同机器人上部署,为通用机器人操作技术发展开辟新路径。

东京大学团队突破视角局限:第一次让机器同时用"我的眼睛"和"他人的眼睛"看世界

东京大学团队突破视角局限:第一次让机器同时用"我的眼睛"和"他人的眼睛"看世界

这是首个系统性探索跨视角协作智能的综合性研究,由南京大学、东京大学等顶尖机构联合完成。研究团队首次将"第一人称视角"与"第三人称视角"的协作应用进行了全面梳理,提出了三大技术方向和十三个关键任务,涵盖从智能厨房到手术机器人的八大应用场景。这项突破性工作为人工智能向人类认知迈进提供了重要的技术路径和理论基础。

北京大学研究团队打造"3D零件拼装师":一张照片就能拆解出完整立体模型的神奇技术

北京大学等机构的研究团队开发出PartCrafter技术,能够从单张照片同时生成多个3D零件组成完整模型,无需预先图像分割。该技术采用创新的局部-全局注意力机制,在保证零件细节的同时确保整体协调性。相比传统先整体后分解的方法,PartCrafter生成速度快18倍,质量更优,甚至能重建照片中不可见的部分,为游戏开发、电影制作、工业设计等领域提供了革命性工具。

访谈:Pega 的 “Blueprint” 破解老旧 IT 的诅咒

Pega 利用 agentic AI 驱动的 Blueprint 工具,自动解析传统软件和业务流程,助力企业加速创新,摆脱遗留 IT 制约。

听声音懂内容:微软与台湾大学研究团队开发音频感知大模型评估说话风格的新方法

听声音懂内容:微软与台湾大学研究团队开发音频感知大模型评估说话风格的新方法

这项由台湾大学与微软研究团队合作的研究探索了使用音频感知大语言模型(ALLMs)作为自动评判员来评估语音生成模型的说话风格。研究设计了"语音风格指令跟随"和"角色扮演"两个任务,测试了四种语音模型的表现,并比较了人类与AI评判的一致性。结果表明,特别是Gemini-2.5-pro模型,其评判结果与人类评判的一致性甚至超过了人类评判者之间的一致性,证明ALLMs可以作为可靠的自动评估工具。同时研究也发现,即使是最先进的语音模型在说话风格控制方面仍有显著改进空间。

Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要

Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要

卡内基梅隆大学研究团队提出全新"Kinetics"缩放定律,揭示大语言模型测试阶段的资源分配策略需要重新思考。研究发现小型模型效率被严重高估,因为以往研究忽略了内存访问成本这一关键瓶颈。在测试阶段,注意力机制而非参数数量成为主要成本因素。基于此,团队提出以稀疏注意力为核心的新范式,显著提升问题解决准确率,在AIME测试中低成本场景下提升高达60个百分点,高成本场景下仍有5个百分点优势。

搜索舞台:加入"放大镜"的大语言模型特性深度剖析 —— 伯克利大学研究团队探索网络搜索增强型AI系统

搜索舞台:加入"放大镜"的大语言模型特性深度剖析 —— 伯克利大学研究团队探索网络搜索增强型AI系统

这项研究由加州大学伯克利分校团队完成,通过创建"Search Arena"平台收集了24,000多次用户与搜索增强型大语言模型的真实交互数据。研究发现用户提问远不止简单事实查询,他们更看重引用丰富的回答,即使引用与内容无直接关联。有趣的是,用户更偏爱社区平台引用,而非维基百科。研究还表明搜索能力不会影响AI在普通场景中的表现,但在需要实时信息时至关重要。这些发现为改进下一代AI助手提供了重要指导。

巴克莱为 100,000 名员工推出 Microsoft Copilot,AI 采用持续加速

巴克莱为 100,000 名员工推出 Microsoft Copilot,AI 采用持续加速

巴克莱银行与 Microsoft 签订协议,将 Copilot 集成到内部生产力工具中,为全球 10 万员工打造一站式 AI 平台,提升工作效率。

全能模型的困境:为什么让AI什么都会可能适得其反?

全能模型的困境:为什么让AI什么都会可能适得其反?

这项来自加州大学戴维斯分校和俄亥俄州立大学的研究探讨了多模态AI训练的一个重要问题:让AI同时学会处理文字、图像、视频等多种信息类型时,是否会影响其原有的语言能力?研究发现,扩展模态确实存在能力权衡,模型合并技术比全模态同步训练更有效,为AI发展提供了重要启示。

‘严重’网络中断全球损失达1600亿美元

‘严重’网络中断全球损失达1600亿美元

思科调查全球逾8065名高级IT及业务领导发现,拥堵、网络攻击和配置错误引发的网络故障每年可能使企业损失达1600亿美元。为迎接AI、IoT和云环境的挑战,现代网络必须更智能、更安全、更灵活。

Microsoft 为 Xbox 掌机精简 Windows 11 繁琐部分

微软展示了与ASUS携手推出的Xbox掌机,搭载精简版Windows 11,舍弃了不必要的系统组件,提升了游戏性能和资源利用率。

Guardz 获得 5600 万美元融资,为小型企业带来企业级网络安全保护

Guardz 获得 5600 万美元融资,为小型企业带来企业级网络安全保护

Guardz 获得 5600 万美元 B 轮融资,通过 AI 驱动的全能安全平台与 MSP 合作,为中小企业提供与大企业同等的网络防护,帮助应对自动化网络攻击。

WWDC 2025:全部发布内容,包括 Liquid Glass、Apple Intelligence 更新及更多

WWDC 2025:全部发布内容,包括 Liquid Glass、Apple Intelligence 更新及更多

Apple在WWDC 2025中推出重大软件更新,包括采用全新液体玻璃界面的iOS26、以年份命名的系统升级、专用游戏应用及多项智能化功能,展现系统革新和便捷体验。

macOS Tahoe 即将推出的新功能

macOS Tahoe 即将推出的新功能

苹果在 WWDC 上宣布 macOS Tahoe,通过智能设计、系统联动及 Spotlight 升级,带来全新用户体验。

Mary Meeker 的科技报告展示了 AI 采纳的步伐与广度

Mary Meeker 的科技报告展示了 AI 采纳的步伐与广度

Mary Meeker 的报告详细解析了 AI 技术在数据、训练与商业应用上的飞速增长,展现了 ChatGPT 等产品快速超越传统搜索的趋势,预示着未来各领域都将迎来全面变革。

Superblocks CEO:如何通过研究 AI 系统提示寻找独角兽创意

Superblocks CEO:如何通过研究 AI 系统提示寻找独角兽创意

Superblocks 创始人 Brad Menezes 指出,AI 应用的核心在于定制化系统提示,通过角色设定、上下文和工具运用,帮助优化 LLM 调用,从而赋能非开发者构建企业级应用。

中科院团队发明"神奇前缀器":让AI训练速度飞起来的革命性技术

中科院团队发明"神奇前缀器":让AI训练速度飞起来的革命性技术

中科院团队提出Prefix Grouper方法,巧妙解决GRPO训练中的重复计算问题。通过将自注意力分解为前缀和后缀两部分,实现共享前缀的高效计算,在长文本场景下可将计算量降至原来的1/G。该方法保持与传统GRPO完全一致的训练效果,同时显著减少内存使用,支持更大组规模训练,具有即插即用特性。