最新文章

北京大学研究团队打造"3D零件拼装师":一张照片就能拆解出完整立体模型的神奇技术

北京大学等机构的研究团队开发出PartCrafter技术,能够从单张照片同时生成多个3D零件组成完整模型,无需预先图像分割。该技术采用创新的局部-全局注意力机制,在保证零件细节的同时确保整体协调性。相比传统先整体后分解的方法,PartCrafter生成速度快18倍,质量更优,甚至能重建照片中不可见的部分,为游戏开发、电影制作、工业设计等领域提供了革命性工具。

访谈:Pega 的 “Blueprint” 破解老旧 IT 的诅咒

Pega 利用 agentic AI 驱动的 Blueprint 工具,自动解析传统软件和业务流程,助力企业加速创新,摆脱遗留 IT 制约。

听声音懂内容:微软与台湾大学研究团队开发音频感知大模型评估说话风格的新方法

听声音懂内容:微软与台湾大学研究团队开发音频感知大模型评估说话风格的新方法

这项由台湾大学与微软研究团队合作的研究探索了使用音频感知大语言模型(ALLMs)作为自动评判员来评估语音生成模型的说话风格。研究设计了"语音风格指令跟随"和"角色扮演"两个任务,测试了四种语音模型的表现,并比较了人类与AI评判的一致性。结果表明,特别是Gemini-2.5-pro模型,其评判结果与人类评判的一致性甚至超过了人类评判者之间的一致性,证明ALLMs可以作为可靠的自动评估工具。同时研究也发现,即使是最先进的语音模型在说话风格控制方面仍有显著改进空间。

Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要

Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要

卡内基梅隆大学研究团队提出全新"Kinetics"缩放定律,揭示大语言模型测试阶段的资源分配策略需要重新思考。研究发现小型模型效率被严重高估,因为以往研究忽略了内存访问成本这一关键瓶颈。在测试阶段,注意力机制而非参数数量成为主要成本因素。基于此,团队提出以稀疏注意力为核心的新范式,显著提升问题解决准确率,在AIME测试中低成本场景下提升高达60个百分点,高成本场景下仍有5个百分点优势。

搜索舞台:加入"放大镜"的大语言模型特性深度剖析 —— 伯克利大学研究团队探索网络搜索增强型AI系统

搜索舞台:加入"放大镜"的大语言模型特性深度剖析 —— 伯克利大学研究团队探索网络搜索增强型AI系统

这项研究由加州大学伯克利分校团队完成,通过创建"Search Arena"平台收集了24,000多次用户与搜索增强型大语言模型的真实交互数据。研究发现用户提问远不止简单事实查询,他们更看重引用丰富的回答,即使引用与内容无直接关联。有趣的是,用户更偏爱社区平台引用,而非维基百科。研究还表明搜索能力不会影响AI在普通场景中的表现,但在需要实时信息时至关重要。这些发现为改进下一代AI助手提供了重要指导。

巴克莱为 100,000 名员工推出 Microsoft Copilot,AI 采用持续加速

巴克莱为 100,000 名员工推出 Microsoft Copilot,AI 采用持续加速

巴克莱银行与 Microsoft 签订协议,将 Copilot 集成到内部生产力工具中,为全球 10 万员工打造一站式 AI 平台,提升工作效率。

全能模型的困境:为什么让AI什么都会可能适得其反?

全能模型的困境:为什么让AI什么都会可能适得其反?

这项来自加州大学戴维斯分校和俄亥俄州立大学的研究探讨了多模态AI训练的一个重要问题:让AI同时学会处理文字、图像、视频等多种信息类型时,是否会影响其原有的语言能力?研究发现,扩展模态确实存在能力权衡,模型合并技术比全模态同步训练更有效,为AI发展提供了重要启示。

‘严重’网络中断全球损失达1600亿美元

‘严重’网络中断全球损失达1600亿美元

思科调查全球逾8065名高级IT及业务领导发现,拥堵、网络攻击和配置错误引发的网络故障每年可能使企业损失达1600亿美元。为迎接AI、IoT和云环境的挑战,现代网络必须更智能、更安全、更灵活。

Microsoft 为 Xbox 掌机精简 Windows 11 繁琐部分

微软展示了与ASUS携手推出的Xbox掌机,搭载精简版Windows 11,舍弃了不必要的系统组件,提升了游戏性能和资源利用率。

Guardz 获得 5600 万美元融资,为小型企业带来企业级网络安全保护

Guardz 获得 5600 万美元融资,为小型企业带来企业级网络安全保护

Guardz 获得 5600 万美元 B 轮融资,通过 AI 驱动的全能安全平台与 MSP 合作,为中小企业提供与大企业同等的网络防护,帮助应对自动化网络攻击。

WWDC 2025:全部发布内容,包括 Liquid Glass、Apple Intelligence 更新及更多

WWDC 2025:全部发布内容,包括 Liquid Glass、Apple Intelligence 更新及更多

Apple在WWDC 2025中推出重大软件更新,包括采用全新液体玻璃界面的iOS26、以年份命名的系统升级、专用游戏应用及多项智能化功能,展现系统革新和便捷体验。

macOS Tahoe 即将推出的新功能

macOS Tahoe 即将推出的新功能

苹果在 WWDC 上宣布 macOS Tahoe,通过智能设计、系统联动及 Spotlight 升级,带来全新用户体验。

Mary Meeker 的科技报告展示了 AI 采纳的步伐与广度

Mary Meeker 的科技报告展示了 AI 采纳的步伐与广度

Mary Meeker 的报告详细解析了 AI 技术在数据、训练与商业应用上的飞速增长,展现了 ChatGPT 等产品快速超越传统搜索的趋势,预示着未来各领域都将迎来全面变革。

Superblocks CEO:如何通过研究 AI 系统提示寻找独角兽创意

Superblocks CEO:如何通过研究 AI 系统提示寻找独角兽创意

Superblocks 创始人 Brad Menezes 指出,AI 应用的核心在于定制化系统提示,通过角色设定、上下文和工具运用,帮助优化 LLM 调用,从而赋能非开发者构建企业级应用。

中科院团队发明"神奇前缀器":让AI训练速度飞起来的革命性技术

中科院团队发明"神奇前缀器":让AI训练速度飞起来的革命性技术

中科院团队提出Prefix Grouper方法,巧妙解决GRPO训练中的重复计算问题。通过将自注意力分解为前缀和后缀两部分,实现共享前缀的高效计算,在长文本场景下可将计算量降至原来的1/G。该方法保持与传统GRPO完全一致的训练效果,同时显著减少内存使用,支持更大组规模训练,具有即插即用特性。

突破传统限制:IIIT海德拉巴和IIT哈拉格普尔团队发布基于输入自注意力的软提示技术,让大语言模型更高效适应特定任务

突破传统限制:IIIT海德拉巴和IIT哈拉格普尔团队发布基于输入自注意力的软提示技术,让大语言模型更高效适应特定任务

这项研究由IIIT海德拉巴的Ananth Muppidi、IIT哈拉格普尔的Abhilash Nandy与Adobe研究院的Sambaran Bandyopadhyay共同完成,提出了一种名为ID-SPAM的创新方法,用于大语言模型的参数高效微调。该方法利用自注意力机制生成基于输入的软提示,使模型能够根据不同输入动态调整处理策略。实验表明,ID-SPAM在GLUE和SuperGLUE基准测试上优于现有软提示方法,并展现出出色的零样本域迁移能力。这一技术保持结构简单的同时,显著提升了模型在特定任务上的适应性。

AI基础设施市场回暖,科技巨头加大投入

AI基础设施市场回暖,科技巨头加大投入

今年早前大跌后,亚马逊、Alphabet、微软、Meta等巨头持续加大AI投资,带动数据中心及设备相关股票大幅反弹,提振市场信心得以迅速恢复。

IT 领导人成功实施 AI 的五大障碍

IT 领导人成功实施 AI 的五大障碍

本文总结了企业推广 AI 过程中面临的五大挑战:数据质量不佳、内部人才不足、竞争激烈的业务场景、陈旧的遗留系统以及员工阻挠。解决这些问题方能释放 AI 的真正价值。

《谍中谍8:最终清算》中出现的“智体”照进现实,哥伦比亚大学研究团队打造出真正的“自进化智体"
2025-06-10

《谍中谍8:最终清算》中出现的“智体”照进现实,哥伦比亚大学研究团队打造出真正的“自进化智体"

当AI学会自我进化:一台能不断重写自身代码的"达尔文哥德尔机器"正在实验室诞生,它像有创造力的厨师,不仅按食谱做菜,还能发明新菜谱并改进烹饪技术——这项突破让AI首次实现真正的自主进化,编程成功率从20%跃升至50%。

HASHIRU:一个能自主调配资源的多智能体系统,让AI团队合作更聪明、更省钱

HASHIRU:一个能自主调配资源的多智能体系统,让AI团队合作更聪明、更省钱

HASHIRU是一个创新的多智能体系统,由加州大学戴维斯研究团队开发,采用"CEO-员工"层级结构,动态管理AI智能体团队。系统优先使用小型本地语言模型,仅在必要时调用更强大的外部API,通过经济模型控制资源分配,并能自主创建新工具扩展功能。实验表明,它在复杂推理任务上显著优于单一模型(如GSM8K:96% vs 61%),并能有效执行学术论文评审和安全评估任务,展现了更灵活、更高效的AI协作新范式。