最新文章
2025-09-19

亚马逊云科技宣布推出Qwen3与DeepSeek-V3.1模型的完全托管服务

2025年9月19日 亚马逊云科技宣布,在Amazon Bedrock上新增Qwen3和DeepSeek-V3.1开放权重模型,进一步扩展Amazon Bedrock上完全托管的行业领先模型阵容,这些模型现已在全球范围内正式可用。

腾讯混元团队推出P3-SAM:让AI像人一样精准拆解3D物体

腾讯混元团队推出P3-SAM:让AI像人一样精准拆解3D物体

腾讯混元团队推出P3-SAM系统,这是首个能够自动精确分割任意3D物体的AI模型。该系统采用原生3D处理方式,摆脱了传统方法对2D投影的依赖,在近370万个3D模型上训练而成。P3-SAM支持完全自动分割和交互式分割两种模式,在多个标准测试中达到领先性能,为游戏开发、工业设计等领域提供了强大的3D理解工具。

NVIDIA推出颠覆性研究工具:让任何人都能定制自己的AI研究助手

NVIDIA推出颠覆性研究工具:让任何人都能定制自己的AI研究助手

NVIDIA Research推出了革命性的UDR系统,让用户可以完全自定义AI研究助手的工作策略。该系统解决了传统研究工具固化、难以专业化定制的问题,支持任意语言模型,用户可用自然语言编写研究策略,系统自动转换为可执行代码。提供三种示例策略和直观界面,实现了AI工具的民主化定制,为专业研究和个人调研提供了前所未有的灵活性。

看音乐谱竟然这么难?加州大学圣地亚哥分校发现AI在读乐谱上的"视力"问题

看音乐谱竟然这么难?加州大学圣地亚哥分校发现AI在读乐谱上的"视力"问题

加州大学圣地亚哥分校研究团队创建了首个"野生"乐谱理解AI测试平台WildScore,通过807个来自Reddit音乐社区的真实问题,系统评估了多模态AI模型的乐谱解读能力。测试结果显示,即使最先进的GPT-4.1模型准确率也仅为68%,在节拍识别等方面表现尤其困难。研究揭示了AI在专业符号系统理解方面的局限性。

ByteDance带来多主体生成新突破:MOSAIC让AI同时画出多个角色不"串戏"

ByteDance带来多主体生成新突破:MOSAIC让AI同时画出多个角色不"串戏"

字节跳动团队开发的MOSAIC系统突破了AI绘画的关键难题:多角色生成时的身份混乱。通过创新的语义对应机制和分离技术,MOSAIC能准确生成包含4个以上主体的复杂图像,每个角色都保持独特特征不串戏。该系统基于120万张精标注图像训练,在权威测试中全面超越现有方法,为AI内容创作带来革命性提升。

阿里巴巴首创医学影像"万能翻译机":一个模型搞定X光、CT、内镜所有影像检索

阿里巴巴首创医学影像"万能翻译机":一个模型搞定X光、CT、内镜所有影像检索

阿里巴巴达摩院联合多所知名高校开发出M3Ret医学影像检索系统,首次实现单一模型处理X光、CT、超声、内镜等多种影像类型。该系统通过86万张真实医院影像进行自监督训练,在多项检索任务中超越现有方法,甚至能在未见过MRI数据情况下准确检索MRI影像,为医学AI的统一化发展开辟新路径。

剑桥大学突破性发现:人工智能竟然无法像人类一样学会新语言?

剑桥大学突破性发现:人工智能竟然无法像人类一样学会新语言?

剑桥大学研究团队通过创造全新人工语言Camlang,发现了人工智能的重大局限:尽管最先进的AI模型在熟悉语言上表现优异,但在学习真正陌生语言时远逊于人类。人类仅凭语法书和词典就能达到87%准确率,而AI最高仅47%,揭示了AI依赖模式匹配而非真正语法推理的本质局限。

天才程序员用AI重新定义虚拟世界创造:NetEase公司推出革命性游戏开发平台LatticeWorld

天才程序员用AI重新定义虚拟世界创造:NetEase公司推出革命性游戏开发平台LatticeWorld

NetEase公司研究团队开发的LatticeWorld框架实现了虚拟世界生成的重大突破。该系统通过自然语言和草图输入,能够快速生成高质量的3D交互虚拟环境,效率比传统方法提升90倍以上。系统结合轻量级语言模型和工业级渲染引擎,支持动态角色交互和实时物理模拟,为游戏开发、教育培训等领域带来革命性变革。

腾讯推出混元翻译:7B参数模型首次突破少数民族语言翻译难题

腾讯推出混元翻译:7B参数模型首次突破少数民族语言翻译难题

腾讯混元团队发布了首个专门优化中文与少数民族语言翻译的开源模型Hunyuan-MT-7B,支持33种语言的双向翻译。该模型在国际机器翻译大赛中获得30项第一名,特别在汉语-维吾尔语、哈萨克语、蒙古语、藏语等翻译任务上实现重大突破,填补了该领域的技术空白。

首次成功制作AI换脸动画视频:首尔国立大学团队如何让照片中的人戴上你想要的眼镜和发型

首次成功制作AI换脸动画视频:首尔国立大学团队如何让照片中的人戴上你想要的眼镜和发型

首尔国立大学研究团队开发出名为Durian的AI技术,能够实现前所未有的肖像动画与属性转移功能。该技术通过双重参考网络架构,仅需两张照片就能生成自然的动态视频,展示人物带着新发型、眼镜或胡须等属性的各种表情动作。与传统方法不同,Durian采用创新的自重建训练策略,无需大量标注数据即可学会属性转移,并支持多属性组合和属性插值等高级功能,在各项性能指标上均超越现有技术。

SimpleQA Verified:谷歌DeepMind发布更可靠的AI事实性评估新基准,揭示大模型"胡编乱造"的真实水平

SimpleQA Verified:谷歌DeepMind发布更可靠的AI事实性评估新基准,揭示大模型"胡编乱造"的真实水平

谷歌DeepMind发布SimpleQA Verified基准,通过严格筛选1000道测试题目和改进评分系统,更准确评估AI事实准确性。测试显示最先进的Gemini 2.5 Pro仅获55.6%准确率,揭示当前AI在事实知识方面仍有较大提升空间。该工具为AI研究提供了更可靠的评估标准,推动开发更值得信赖的AI系统。

ByteDance Seed团队突破AI数学难题:让机器像顶尖数学家一样证明定理

ByteDance Seed团队突破AI数学难题:让机器像顶尖数学家一样证明定理

字节跳动种子团队开发出突破性AI数学证明系统BFS-Prover-V2,通过创新的多智能体协作和自适应训练方法,在MiniF2F测试中达到95.08%成功率,在ProofNet测试中达到41.4%成功率,展现出接近顶尖数学家的证明能力。该系统采用"规划师-证明者"分工协作模式,能够将复杂数学定理分解为简单子目标,并通过动态重规划机制灵活应对困难问题,为AI复杂推理能力树立了新标杆。

Salesforce AI研究院如何让AI代理像人类研究员一样独立深度调研?

Salesforce AI研究院如何让AI代理像人类研究员一样独立深度调研?

Salesforce AI研究院开发的SFR-DeepResearch系统通过创新的强化学习方法,成功训练出能够独立进行复杂深度研究的AI代理。该系统采用单一代理架构,配备基础工具集,通过长度标准化奖励机制避免无效工具调用,在多个基准测试中表现优异,最佳版本在Humanity's Last Exam中达到28.7%准确率,为AI向自主问题解决者转变提供了重要突破。

从手绘图到3D模型:AI如何让工程师的草图自动变成精密CAD设计

从手绘图到3D模型:AI如何让工程师的草图自动变成精密CAD设计

杭州电子科技大学等多所院校联合研究团队开发出革命性AI系统Drawing2CAD,能够直接从工程图纸自动生成精密三维CAD模型。该系统采用创新的双解码器架构和柔性损失函数,使用矢量格式图纸保留精确几何信息,在多项测试中显著优于传统像素化方法。研究团队还构建了包含15万多个样本的大规模数据集CAD-VGDrawing,为工程设计自动化提供了重要突破。

谷歌发布智能体驱动购物新协议

谷歌发布智能体驱动购物新协议

谷歌发布代理支付协议AP2,支持AI代理代表用户自动购物和决策。该开放协议获得60多家商户和金融机构支持,旨在实现AI平台、支付系统和供应商间的互操作性。协议要求两级审批机制:意图授权和购物车授权,确保交易可追溯。支持全自动购买和加密货币支付。万事达、美国运通、PayPal等主要金融服务商已表示支持。

CrowdStrike推出智能体安全平台,重塑企业网络安全运营

CrowdStrike推出智能体安全平台,重塑企业网络安全运营

CrowdStrike在其年度Fal.Con 2025大会上发布了智能代理安全平台和智能代理安全团队两款新产品,旨在应对AI时代日益增长的安全需求。新平台基于企业图谱架构,统一企业遥测数据,配备AI优化查询语言。Charlotte AI AgentWorks提供无代码平台,让安全团队可轻松构建和部署可信安全代理。智能代理安全团队则通过AI驱动的代理直接服务客户,解决传统防御无法应对AI速度威胁的问题。

Workday以11亿美元收购Sana Labs强化智能体AI工作体验

Workday以11亿美元收购Sana Labs强化智能体AI工作体验

人力资源和财务软件巨头Workday宣布以约11亿美元收购AI企业知识和员工培训工具公司Sana Labs。同时发布了面向HR、财务和行业应用的新AI智能体,以及包含低代码智能体构建器的开发者平台。Sana的产品包括AI教练工具Sana Learn和知识助手Sana Agents,能够提供超个性化技能培训并自动化重复性知识任务,已为客户实现高达95%的时间节省和90%的生产力提升。

VergeIO联手Cirrus Data争夺虚拟化市场用户

VergeIO联手Cirrus Data争夺虚拟化市场用户

VergeIO利用Cirrus Data的数据迁移软件,说服客户从其他虚拟化环境迁移至其VergeOS平台,旨在终结基础设施分散问题。VergeOS是该公司的超融合数据中心软件,将虚拟化、存储、网络和AI集成到单一操作系统中。通过Cirrus Migrate Cloud,VergeIO可帮助客户从VMware、Hyper-V、Nutanix等平台迁移。公司声称,整合到VergeOS可降低三年总拥有成本超50%。

AI教父警告:社会尚未为人工智能经济冲击做好准备

AI教父警告:社会尚未为人工智能经济冲击做好准备

诺贝尔奖得主、"AI之父"杰弗里·辛顿在接受《金融时报》采访时发出严厉警告,批评硅谷领袖对AI社会效益的乐观叙述具有误导性。他认为,富人将利用AI大规模替代人工,造成大量失业和利润激增,使少数人更富有而多数人更贫穷。辛顿强调这并非AI本身的问题,而是资本主义制度的结果。他还预测超级智能AI将在5-20年内出现,呼吁社会认真准备应对这一变革。

AI赋能建筑师:打破设计边界的智能工具

AI赋能建筑师:打破设计边界的智能工具

洛杉矶建筑公司OFA Group开发了AI工具PlanAid和QikBIM,帮助建筑师解决设计和施工中的痛点。PlanAid可实时读取蓝图并标记潜在的消防安全问题和规范违规,让建筑师提前解决问题避免多轮修改。QikBIM能自动生成工程示意图,大幅缩短项目时间。此外,Spacely.ai、Planner 5D等AI室内设计工具也让用户能够虚拟预览空间改造效果,将创意想法转化为可视化现实。