人工智能文章列表第27页-至顶网频道

2025-10-13

瑞士AI联盟发布全球首个真正开源的大型语言模型：Apertus如何用15万亿字符数据改写AI训练规则

瑞士AI联盟发布全球首个真正开源的大型语言模型Apertus，在15万亿字符、1811种语言数据上训练。该模型采用创新的"金鱼损失"技术防止逐字记忆，严格遵循数据合规标准，提供80亿和700亿参数版本。研究团队完全公开训练代码、数据处理脚本等所有技术细节，树立了透明、可信赖的AI开发新标准。

AI地震检测技术：像戴上眼镜一样清晰

过去七年中，基于机器学习的AI工具几乎完全自动化了地震学的基础任务——地震检测。AI模型能够检测到比人工分析师更小的地震，特别是在城市等嘈杂环境中。斯坦福团队开发的地震变换器等模型使用一维卷积和注意力机制，在包含120万个人工标记样本的数据集上训练。这些工具通常能发现比传统方法多10倍以上的地震，为火山结构成像和地质研究提供了更全面的地震目录。

医疗集团CIO采用AI提升生产力，在联络中心谨慎推进AI应用

杰斐逊城市医疗集团作为密苏里州中部最大的多专科医疗服务机构，正在使用AI管理会议、简化临床文档和优化医疗流程。该集团在联络中心AI应用方面较为谨慎，担心完全数字化会影响患者体验。CIO表示未来会在统一通信平台集成AI，但部署时机将由医疗专业人员决定。目前已采用AI辅助临床文档记录和会议管理功能。

仅需250个恶意文档就能让大语言模型产生后门漏洞

研究人员发现，大型语言模型如ChatGPT、Gemini和Claude仅需250个恶意文档就能被植入后门漏洞。研究测试了6亿到130亿参数的模型，发现无论模型规模如何，植入后门所需的恶意样本数量基本恒定，而非按比例增长。攻击者可通过在训练数据中插入特定触发短语的文档，操控模型输出。虽然现有安全训练可在很大程度上修复这些后门，但研究强调需要更强的防御策略来应对这一威胁。

CIO们利用AI助力IT采购决策，超八成决策者已开始使用

研究显示，超过81%的IT决策者正在采用AI技术辅助IT采购过程。AI主要应用于供应商评估审查、解决方案推荐、RFP自动化创建以及采购后性能ROI测量等环节。多家企业案例表明，AI能够显著缩短供应商评估时间，从数周压缩至数天，同时帮助识别兼容性问题和合同异常条款。企业普遍采用"信任但验证"的方式，将AI输出作为决策输入而非最终答案，确保人工最终审核。

RLDP：卢森堡大学让隐私保护AI训练的颠覆性突破——一种自学习的"智能管家"让数据安全与模型效果完美共存

卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化，创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练，能动态调整隐私保护策略，在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短，同时增强了抗隐私攻击能力，为敏感数据的AI应用开辟了新路径。

腾讯混元团队发布MixGRPO：让AI图像生成训练效率提升71%的混合式加速方案

腾讯混元团队联合北京大学提出MixGRPO技术，通过混合ODE-SDE采样策略和滑动窗口机制，将AI图像生成训练效率提升50%-71%，同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略，专注于图像生成早期阶段的重点优化，并引入高阶求解器进一步加速训练过程，为AI图像生成的产业化应用提供了更高效可行的解决方案。

人工智能正以超出预期的速度改变软件世界。本周OpenAI发布ChatGPT应用，谷歌推出Gemini Enterprise平台，亚马逊发布Quick Suite，都旨在通过AI代理改造9000亿美元的企业软件市场。尽管存在泡沫担忧，AI资金仍持续涌入，Reflection AI获20亿美元融资，n8n获1.2亿美元投资。同时硬件需求激增，OpenAI采购100亿美元AMD硬件，马斯克xAI为第二个数据中心采购180亿美元英伟达芯片，可能引发长达十年的定价危机。

人工智能

语音交互

应用集成

2025-10-11

Spotify已可连接ChatGPT：互动功能体验升级

OpenAI本周推出开发者应用集成功能，允许用户直接通过ChatGPT与第三方应用交互。Spotify成为首批合作伙伴之一，用户可要求ChatGPT创建播放列表、推荐歌曲等。连接账户后，AI可访问用户喜好和听歌历史，提供个性化建议。该功能支持145个国家的所有ChatGPT用户使用，但需注意数据隐私风险。

人工智能

计算机视觉

企业收购

2025-10-11

Apple 收购计算机视觉初创公司 Prompt AI

据报道，苹果收购Prompt AI的交易基本确定，该初创公司领导层已召开全体会议讨论协议细节。Prompt的核心产品Seemour将AI技术应用于安防摄像头，可识别特定人员、宠物和物体，发送异常活动警报并提供文字描述。这种收购人才和技术而非整个公司的策略已成为科技巨头在AI领域的常见做法，部分为了避免监管审查。

人工智能

自然语言处理

系统集成

2025-10-11

Windows Copilot现可创建Office文档并连接Gmail

微软Windows Copilot功能获得重大更新，现在支持直接创建Office文档，包括Word、Excel和PowerPoint文件。此外，新版本还增加了Gmail连接功能，用户可以通过Copilot智能助手管理和处理邮件。这些新功能进一步增强了Windows系统的办公效率和跨平台协作能力。

人工智能

3D模型评估

计算机视觉

2025-10-11

上海AI实验室最新研究：让电脑真正"看懂"3D模型好坏的智能评判系统

这项研究开发了Hi3DEval系统，这是首个能够从整体、局部和材质三个层面全面评估3D模型质量的智能系统。通过创新的视频分析和3D几何特征结合方法，系统在各项评估指标上都显著超越了传统方法，为3D内容创作提供了标准化的质量检测工具，在游戏开发、虚拟现实、电商展示等领域具有广阔的应用前景。

人工智能

智能体优化

自进化系统

2025-10-11

格拉斯哥大学等顶尖高校联合提出AI智能体自进化三定律：打造永续学习的人工智能系统

这项由格拉斯哥大学等顶尖高校联合开展的突破性研究，首次系统性提出了"自进化AI智能体"概念框架，将AI发展划分为四个阶段并提出三定律指导原则。研究详细阐述了从单智能体到多智能体系统的优化方法，涵盖思维能力、记忆管理、工具使用等多个维度，并分析了生物医学、编程、金融法律等专业领域的定制化应用，为构建能够持续学习和自我改进的下一代AI系统提供了理论基础和实践指导。

人工智能

视频生成技术

内容创作工具

2025-10-11

Mirage颠覆视频制作：Captions公司让AI一句话变身专业导演

Mirage是由Captions公司开发的革命性AI视频制作平台，用户只需用文字描述创意想法，系统就能自动生成专业水准的短视频内容。该技术基于专门训练的AI模型，深度理解社交媒体视频的节奏和吸引力法则。目前拥有超过10万日活用户和2000万注册用户，每月产生300万个视频。平台提供个人版Captions应用和企业版Mirage Studio，后者支持大规模内容制作和快速A/B测试，正在重新定义数字内容创作的门槛和效率。

人工智能

代码输入输出预测

通用推理能力

2025-10-11

复旦大学团队革命性突破：用代码教AI推理，让机器学会"举一反三"的思考艺术

这项由复旦大学等机构合作完成的研究提出了CodeI/O方法，通过让AI学习预测代码的输入输出来提升通用推理能力。该方法将45万个代码文件转化为350万个训练样本，让AI用自然语言推理代码逻辑，从而掌握逻辑规划、状态搜索等推理技能。实验显示，在14个评测基准上，CodeI/O训练的模型在符号、科学、逻辑、数学等推理任务上都实现了均衡显著的性能提升。

人工智能

文本压缩

记忆机制

2025-10-11

把1568个字符塞进一个向量再完美复原：AIRI实验室发现AI记忆力的惊人极限

这项由俄罗斯AIRI实验室主导的突破性研究发现，AI模型的单个记忆向量能够完美压缩和复原多达1568个文本片段，压缩比达到1500倍。研究测试了14个不同模型，揭示了AI系统巨大的未开发记忆潜力，但当前利用率仅30%。这一发现不仅挑战了对AI记忆机制的传统认知，更为未来更高效的AI系统设计开辟了新方向，有望让AI助手拥有更强的长期记忆和信息处理能力。

清华联手阿里巴巴团队重磅发布S?-Guidance：让AI画图和做视频告别模糊失真，轻松生成电影级画面

人工智能

扩散模型

随机引导技术

2025-10-11

清华联手阿里巴巴团队重磅发布S?-Guidance：让AI画图和做视频告别模糊失真，轻松生成电影级画面

清华大学与阿里巴巴合作开发的S?-Guidance技术，通过创新的"随机自引导"方法解决了AI图像和视频生成中的质量问题。该技术无需额外训练，仅通过随机屏蔽模型部分功能来创建内部"顾问"，指导AI避免低质量输出。实验显示在多个评估维度上显著超越传统方法，人类专家评价中获得31%偏好率，计算开销仅增加20%。

斯坦福大学等顶尖机构联合发布：大语言模型架构的"减速新方案"，谁说速度总是胜利？

人工智能

机器学习

架构优化

2025-10-11

斯坦福大学等顶尖机构联合发布：大语言模型架构的"减速新方案"，谁说速度总是胜利？

这项由上海人工智能实验室等多家国际机构联合完成的研究系统性地梳理了大语言模型高效架构的最新进展。论文将创新方法分为七大类：线性序列建模、稀疏序列建模、高效全注意力、稀疏专家混合、混合架构、扩散语言模型和跨模态应用。研究揭示了如何在保持AI能力的同时大幅降低计算成本，为AI技术的可持续发展和广泛应用提供了重要指导。

人工智能

评测基准

大型语言模型

2025-10-11

大型语言模型能力测试大揭秘：中科院团队发布283个评测基准全景分析

中科院深圳先进技术研究院团队首次全面梳理了大型语言模型评测领域，分析了283个代表性基准，将其归纳为通用能力、领域专业和特定目标三大类别。研究揭示了现有评测体系面临的数据污染、文化偏见和静态评测等关键挑战，为构建更科学公正的AI评测框架提供了重要指导，推动人工智能技术向更安全可靠的方向发展。

人工智能

网络路由技术

横向扩展架构

2025-10-11

思科发布升级版数据中心路由系统和AI芯片

思科推出8223路由系统和Silicon One P200芯片，用于满足企业日益增长的AI工作负载需求。该系统提供51.2 Tbps以太网固定路由器，P200芯片实现超过3艾比特每秒的互连带宽规模。新设备采用深缓冲设计，相比前代产品节能65%，支持跨数据中心AI集群分布式部署，解决物理空间和电力容量限制问题。

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: