人工智能 关键字列表
大模型训练的"调味料"革命:这种简单方法让AI学习速度提升10倍

大模型训练的"调味料"革命:这种简单方法让AI学习速度提升10倍

深圳大学、腾讯等机构联合提出ReDit方法,通过在离散奖励信号中添加随机噪音解决AI训练中的梯度不稳定问题。该方法将学习速度提升约10倍,在数学推理等任务上显著改善模型性能,为大语言模型训练提供了简洁高效的优化方案。

Genspark超级智能体:从代码"摆烂"到工作"摆烂"的企业级AI新范式

Genspark超级智能体:从代码"摆烂"到工作"摆烂"的企业级AI新范式

Genspark推出超级智能体,将"氛围编程"概念扩展至企业工作流程,实现"氛围工作"模式。该系统采用9个大语言模型的专家混合架构,配备80多种工具和10多个数据集,通过规划-执行-观察-回溯循环运行。系统能自主处理复杂业务任务,甚至代替用户拨打电话。45天内实现3600万美元年收入,展现了自主智能体平台的商业可行性,挑战传统企业AI架构理念。

AI智能代理将彻底变革医疗保健行业

AI智能代理将彻底变革医疗保健行业

医疗保健已成为AI应用的热点领域,在疾病诊断、康复监测和新药开发方面证明了其价值。然而,行业仍面临临床人员短缺、人口老龄化等挑战。AI智能体作为下一波AI变革浪潮,相比现有AI工具,能够执行更复杂的任务并减少人工干预。它们不仅能被动提供信息,还能主动采取行动,如自动分诊调度、辅助临床决策、远程患者监护等,有望在十年内彻底改变医疗服务的提供、管理和体验方式。

Meta为WhatsApp引入AI消息摘要功能

Meta为WhatsApp引入AI消息摘要功能

Meta宣布为WhatsApp推出AI驱动的消息摘要功能,可自动总结聊天中的未读消息,且仅用户本人可见。该功能采用私有处理技术,确保Meta AI在不影响加密和用户隐私的前提下生成摘要。目前该功能率先在美国推出英语版本,今年晚些时候将扩展到更多国家和语言。用户可通过设置中的私有处理选项管理相关AI功能。

Creative Commons推出CC signals框架构建开放AI生态系统

Creative Commons推出CC signals框架构建开放AI生态系统

非营利组织Creative Commons宣布推出CC信号项目,允许数据集持有者详细说明其内容如何被机器重复使用,特别是在AI模型训练方面。该项目旨在平衡互联网开放性与AI对数据需求之间的关系,为数据控制者和AI训练者提供法律技术解决方案。目前项目处于早期设计阶段,计划2025年11月进行内测。

Google为开发者终端引入Gemini CLI工具

Google为开发者终端引入Gemini CLI工具

Google正式向开发者推出Gemini CLI工具,该工具可直接在终端中使用Gemini人工智能功能。开发者可通过命令行界面快速访问Gemini的各项AI能力,包括代码生成、问题解答和文本处理等功能,极大提升开发效率和工作流程的便利性。

Microsoft和Georgia Tech联手打造AI"瘦身教练":让超大AI模型也能在普通电脑上跑起来

Microsoft和Georgia Tech联手打造AI"瘦身教练":让超大AI模型也能在普通电脑上跑起来

Microsoft和Georgia Tech研究团队开发了SlimMoE技术,能将超大AI模型压缩到原来的10-20%大小而性能基本不变。该技术采用多阶段渐进式压缩,保留所有专家模块但精简内部结构,成功将419亿参数的模型压缩为76亿和38亿参数版本,让原本需要企业级硬件的AI能力可在普通电脑上运行,大大降低了AI技术使用门槛。

超级压缩术:让AI大脑瘦身87.5%的神奇技术——麻省大学阿默斯特分校团队破解内存瓶颈难题

超级压缩术:让AI大脑瘦身87.5%的神奇技术——麻省大学阿默斯特分校团队破解内存瓶颈难题

麻省大学阿默斯特分校联合MIT等机构提出CommVQ技术,通过创新的交换向量量化方法,将AI模型长文本处理的内存需求降低87.5%,实现2位量化下几乎无损性能,1位量化下仍保持优秀表现,让普通显卡也能运行128K文本长度的大模型,显著降低了先进AI技术的使用门槛。

巴西圣保罗1400万新生儿数据揭示:AI预测婴儿死亡准确率达99%

巴西圣保罗1400万新生儿数据揭示:AI预测婴儿死亡准确率达99%

这项国际合作研究基于巴西圣保罗1400万新生儿数据,运用7种AI算法预测新生儿28天内死亡风险。研究发现LSTM深度学习算法预测准确率高达99%,远超传统机器学习方法的94%。该技术能帮助医生提前识别高危婴儿并采取预防措施,对改善全球新生儿健康状况具有重要意义,特别适用于医疗资源匮乏地区。

华盛顿大学新发明:让你的电脑同时运行多个AI应用而不卡顿的神奇测试工具

华盛顿大学新发明:让你的电脑同时运行多个AI应用而不卡顿的神奇测试工具

华盛顿大学研究团队开发了ConsumerBench测试框架,专门评估个人设备上多AI应用并发运行的性能。研究发现贪婪资源分配导致应用间严重不公平,语音识别等轻量应用被图像生成等重型应用"饿死";静态GPU分区虽然公平但效率低下;模型共享存在配置冲突。该框架为个人设备AI应用优化提供了重要指导。

香港科技大学团队首次系统性评估AI安全卫士:揭秘大模型守护者的能力与弱点

香港科技大学团队首次系统性评估AI安全卫士:揭秘大模型守护者的能力与弱点

这项由香港科技大学领导的研究首次建立了大语言模型安全守护栏的系统性评估框架。研究团队对13种主流守护栏进行了全面测试,提出了六维分类体系和SEU三维评估标准,揭示了不同守护栏在安全性、效率和实用性方面的权衡关系,为AI安全防护技术的选择和部署提供了科学指导。

Meta AI首次破解自回归图像生成的数字水印技术——像给AI生成的图片打上隐形身份证

Meta AI首次破解自回归图像生成的数字水印技术——像给AI生成的图片打上隐形身份证

Meta FAIR等机构首次成功将语言模型水印技术应用于自回归图像生成,解决了图像水印领域的关键技术难题——反向循环一致性缺失。通过专门的模型微调和水印同步层,实现了对AI生成图片的可靠来源追踪,准确率接近100%,且不影响图片质量。该技术在多个主流图像生成模型上验证有效,为AI内容监管提供了重要技术支撑。

机器也会做白日梦?麻省大学让AI学会"脑补"进行推理

机器也会做白日梦?麻省大学让AI学会"脑补"进行推理

这项研究提出了Mirage框架,让AI学会像人类一样进行"心理想象"推理。通过生成压缩的潜在视觉标记而非完整图像,该方法在多个空间推理任务上显著超越传统文字推理和图像生成方法,为AI推理能力发展开辟了新路径。

Arelion升级斯堪的纳维亚网络打造AI超级高速公路

Arelion升级斯堪的纳维亚网络打造AI超级高速公路

Arelion升级其斯堪的纳维亚网络,连接超大规模数据中心以支持该地区蓬勃发展的AI市场。该网络基于1.6Tbps波长和可扩展400G相干可插拔光学技术,在奥斯陆、斯德哥尔摩和哥本哈根之间构建AI"超级高速公路"。升级将为企业客户提供增强的全球互联网骨干网接入和多样化连接服务。预计2025年第二季度末完成,并计划在2025年剩余时间及2026年继续投资。

CloudBees CEO警告:客户开始放慢AI"黑盒"代码应用

CloudBees CEO警告:客户开始放慢AI"黑盒"代码应用

CloudBees首席执行官Anuj Kapur表示,AI可能重新测试DevOps的基础假设,但警告不要为追求效率而创建黑盒代码。他指出,一些因担心错失机会而匆忙采用AI生成代码的客户正开始放缓步伐,变得更加谨慎。Kapur认为,将整代软件外包给提示工程将创建非人类生成的黑盒代码,虽然效率高但质量、测试覆盖率和漏洞问题值得担忧。

Rubrik收购Predibase以加速AI智能体应用普及

Rubrik收购Predibase以加速AI智能体应用普及

数据网络安全公司Rubrik宣布收购AI初创公司Predibase,交易金额在1-5亿美元之间。Predibase专注于帮助企业训练和微调开源AI模型。此次收购将使Rubrik用户能够通过Amazon Bedrock、Azure OpenAI和Google Agentspace等平台加速构建AI智能体。这是继Salesforce、Snowflake等公司之后,又一家通过收购来增强AI智能体技术栈的企业。

Aquant推出"检索增强对话"方法革新AI知识生成

Aquant推出"检索增强对话"方法革新AI知识生成

人工智能平台提供商Aquant推出"检索增强对话"(RAC)新技术,改变大语言模型信息检索和呈现方式。与传统检索增强生成(RAG)一次性提供完整答案不同,RAC采用逐步对话模式,像领域专家一样通过提问填补知识空白,生成定制化解决方案。该技术能整合手册、交易数据、作业历史等多种数据源,在成本、风险和时间之间找到最佳平衡,预计两年内成为AI检索指导的主要机制。

Anthropic升级Claude推出可分享AI应用和体验功能

Anthropic升级Claude推出可分享AI应用和体验功能

Anthropic今日升级其Artifacts功能,为用户提供与Claude AI模型协作的实时专用工作空间。升级后用户可将AI功能直接嵌入创作中,转化为AI驱动应用。自功能推出以来,数百万用户已创建超5亿个作品,包括生产力应用和教育游戏。新功能支持创建"会思考"的应用,如记忆选择的游戏角色、智能导师等。用户可免费分享创作,任何Claude账户都可访问。

新加坡国立大学团队开发"拖拽式"AI模型:让大模型适应新任务只需几秒钟

新加坡国立大学团队开发"拖拽式"AI模型:让大模型适应新任务只需几秒钟

新加坡国立大学团队开发出革命性的"拖拽式"AI技术DnD,能够在几秒钟内直接从文本描述生成大语言模型参数,无需传统耗时的训练过程。该技术在多个任务上表现优异,效率比传统方法提升2500-12000倍,为AI模型的快速定制化应用开辟了全新路径。

Snyk收购Invariant Labs以扩展AI智能体安全能力

Snyk收购Invariant Labs以扩展AI智能体安全能力

网络安全公司Snyk宣布收购瑞士人工智能安全研究公司Invariant Labs,收购金额未公开。Invariant Labs从苏黎世联邦理工学院分拆成立,专注于帮助开发者构建安全可靠的AI代理工具和框架。该公司提供Explorer运行时观察仪表板、Gateway轻量级代理、Guardrails策略引擎等产品,并在工具中毒和模型上下文协议漏洞等新兴AI威胁防护方面处于领先地位。此次收购将推进Snyk保护下一代AI原生应用的使命。