人工智能 关键字列表
德州农工大学开发的"模糊大脑"系统:用AI在网络安全竞赛中找出软件漏洞并自动修复

德州农工大学开发的"模糊大脑"系统:用AI在网络安全竞赛中找出软件漏洞并自动修复

德州农工大学研究团队开发的FuzzingBrain系统,结合大语言模型和传统模糊测试技术,能够自动发现软件安全漏洞并生成修复补丁。在DARPA人工智能网络挑战赛中获得第四名,成功发现28个漏洞包括6个零日漏洞。系统采用大规模并行架构,实现了智能化的漏洞检测和修复流程,为网络安全防护提供了新的技术路径。

谷歌让AI更易获取真实世界数据

谷歌让AI更易获取真实世界数据

谷歌发布数据共享模型上下文协议服务器,使开发者和AI智能体能够通过自然语言访问真实世界统计数据。该服务整合了政府调查、行政数据和联合国等全球机构的公共数据集。新服务旨在解决AI系统训练中常见的数据噪声和幻觉问题,为AI提供可验证的结构化信息。谷歌还与ONE Campaign合作推出数据智能体工具,该开源服务器兼容任何大语言模型。

微软为Copilot引入Anthropic AI模型

微软为Copilot引入Anthropic AI模型

微软宣布从周三开始将Anthropic的AI模型集成到其Copilot助手中,此前该助手主要依赖OpenAI技术。企业用户可在OpenAI的深度推理模型和Anthropic的Claude Opus 4.1、Claude Sonnet 4之间选择,用于复杂研究和构建定制AI工具等任务。此举标志着微软与OpenAI这对曾经独家合作伙伴关系的进一步松动。

AI训练新模式:群体智慧让小型语言模型变得更聪明——Gensyn团队的分布式协作训练突破

AI训练新模式:群体智慧让小型语言模型变得更聪明——Gensyn团队的分布式协作训练突破

Gensyn团队提出SAPO分布式AI训练方法,让普通设备通过分享学习经验协作训练语言模型。实验显示,采用50%本地和50%外部经验的均衡策略,小型AI模型性能提升94%。该方法避免了传统分布式训练的同步瓶颈,为AI训练民主化开辟新路径。

英国曼彻斯特大学研究团队发现:AI语言模型竟然无法理解"高深的废话"

英国曼彻斯特大学研究团队发现:AI语言模型竟然无法理解"高深的废话"

曼彻斯特大学研究团队发现,尽管AI语言模型在多数任务中表现优异,但在理解"Drivelology"(一种表面荒诞但蕴含深意的语言现象)时却频频失误。研究团队构建了涵盖六种语言的1200多个样本数据库,通过四项测试发现AI模型难以掌握这类文本的讽刺意图和文化内涵,揭示了当前AI在语用理解方面的根本局限。

苹果推出SimpleFold:轻量级蛋白质折叠预测AI模型

苹果推出SimpleFold:轻量级蛋白质折叠预测AI模型

苹果研究人员开发出SimpleFold,这是一个轻量级的蛋白质折叠预测AI模型。与谷歌DeepMind的AlphaFold等需要极其昂贵计算资源的模型不同,SimpleFold采用流匹配模型技术,跳过多个去噪步骤,降低计算成本并提升生成速度。研究团队训练了从1亿到30亿参数的多个版本,在CAMEO22和CASP14基准测试中表现出色,且模型规模越大性能越好。

Modular获2.5亿美元融资,简化AI硬件部署

Modular获2.5亿美元融资,简化AI硬件部署

AI初创公司Modular完成2.5亿美元C轮融资,估值达16亿美元。该公司提供统一平台,让开发者无需重写代码即可在不同芯片上运行AI应用,包括CPU、GPU、ASIC和定制芯片。公司旨在打破英伟达CUDA的垄断局面,为企业提供更多硬件选择自由。其平台已支持英伟达、AMD和苹果架构,在新一代加速器上性能提升20%-50%。

Google推出数据公地MCP服务器,为AI智能体提供可信数据支撑

Google推出数据公地MCP服务器,为AI智能体提供可信数据支撑

谷歌发布Data Commons模型上下文协议服务器,为AI开发者提供标准化访问公共数据集的新工具。该服务器连接谷歌2018年推出的开放知识库Data Commons,整合经济、健康、人口和环境等领域的公共数据集。通过标准化接口,AI系统可直接查询数据而无需管理复杂API,有效减少模型幻觉问题,为构建数据驱动的智能体应用奠定基础,提升AI输出的准确性和可信度。

英国250强企业高管呼吁电网升级以支持AI数据中心扩张

英国250强企业高管呼吁电网升级以支持AI数据中心扩张

英国能源网络协会对101名富时250指数高管的调查显示,90%的受访者认为电网升级对释放高增长行业潜力至关重要,超过80%表示没有这些升级英国将无法在全球竞争。调查指出,这一需求对支撑AI模型训练和云计算的数据中心尤为迫切。55%的受访者对英国成为AI全球领导者有信心,但实现这一目标依赖于可靠的高容量电力供应。预计到2030年英国数据中心容量将增至3.3-6.3GW。

美光科技在AI驱动DRAM浪潮中创下收入记录

美光科技在AI驱动DRAM浪潮中创下收入记录

美光第四季度营收达113.2亿美元,创历史新高,同比增长46%。全年营收373.8亿美元,同比增长48.9%。DRAM收入同比增长69%至90亿美元,占总收入80%,而NAND收入下降5%至23亿美元。HBM收入接近20亿美元,年化收入约80亿美元。公司1γ DRAM技术达到成熟良率,并开始向主要超大规模客户出货。预计下季度收入125亿美元,同比增长43.5%。

Creatio推出"自带模型"功能,让企业自主选择AI模型

Creatio推出"自带模型"功能,让企业自主选择AI模型

无代码平台开发商Creatio发布新功能,允许企业自主选择大语言模型进行AI部署。该"自带模型"功能支持OpenAI、Anthropic和谷歌Gemini等主流模型,可在私有云或本地环境中部署以满足数据主权要求。公司将AI代理直接嵌入核心CRM应用和工作流程中,计划2025年底支持模型上下文协议。Creatio上一财年增长45%,主要来自新客户获取和大企业账户扩展。

阿里巴巴云平台将集成英伟达物理AI开发工具

阿里巴巴云平台将集成英伟达物理AI开发工具

阿里巴巴宣布将英伟达的机器人、自动驾驶和智能空间AI开发工具集成到其云端AI平台中。阿里巴巴将提供英伟达的物理AI软件栈,可构建真实环境的3D副本并生成合成数据来训练AI模型。此次合作标志着全球领先的AI芯片开发商与主要云服务提供商的重要合作。阿里巴巴还发布了最新的通义千问3-Max大语言模型。

Salesforce从AI模型转向智能体AI战略转型

Salesforce从AI模型转向智能体AI战略转型

Salesforce正从部署大型语言模型转向开发专业化、高效且可信的AI智能体,以解决特定商业挑战。该公司首席科学家表示,AI的真正价值不在于底层模型,而在于构建其上的智能体能力。Salesforce将智能体分解为记忆、推理大脑、用户界面和功能调用四个关键组件,并开发了大型动作模型来提升API调用准确性。公司还推出企业通用智能概念,专注于商业关键领域的智能体能力突破。

MemVerge推出开源AI内存层助力大语言模型发展

MemVerge推出开源AI内存层助力大语言模型发展

MemVerge发布开源MemMachine软件项目,为大语言模型和AI智能体提供跨平台长上下文记忆层。该软件虚拟化DRAM,结合服务器CPU内存与外部存储层,支持情景记忆、语义记忆、程序记忆和档案记忆四种模式。在LoCoMo长上下文记忆测试中,MemMachine准确率达85%,领先于ChatGPT等竞品,旨在将AI助手从一次性聊天机器人转变为可信赖的上下文感知协作伙伴。

大语言模型为什么老是"胡编乱造"?OpenAI团队揭开AI幻觉的真相

大语言模型为什么老是"胡编乱造"?OpenAI团队揭开AI幻觉的真相

OpenAI团队的最新研究揭示了大语言模型产生幻觉的根本原因:AI就像面临难题的学生,宁愿猜测也不愿承认无知。研究发现,即使训练数据完全正确,统计学原理也会导致AI产生错误信息。更重要的是,现有评估体系惩罚不确定性表达,鼓励AI进行猜测。研究提出了显式置信度目标等解决方案,通过改革评估标准让AI学会诚实地说"不知道",为构建更可信的AI系统指明方向。

ByteDance AI实验室发布重磅研究:让计算机学会"逆向思考",解决创意写作难题

ByteDance AI实验室发布重磅研究:让计算机学会"逆向思考",解决创意写作难题

字节跳动AI实验室提出"逆向工程推理"新范式,通过从优质作品反推思考过程的方式训练AI进行创意写作。该方法创建了包含2万个思考轨迹的DeepWriting-20K数据集,训练的DeepWriter-8B模型在多项写作评测中媲美GPT-4o等顶级商业模型,为AI在开放性创意任务上的应用开辟了新道路。

电脑终于学会了像人类一样用键盘鼠标:ByteDance推出会玩游戏的AI助手

电脑终于学会了像人类一样用键盘鼠标:ByteDance推出会玩游戏的AI助手

ByteDance Seed团队开发的UI-TARS-2是一个革命性的AI助手,能够通过观看屏幕并用鼠标键盘操作电脑,就像人类一样完成各种任务和游戏。该系统采用创新的"数据飞轮"训练方法,在多项测试中表现出色,游戏水平达到人类的60%左右,在某些电脑操作测试中甚至超越了知名AI产品,展现了AI从对话工具向真正智能助手演进的巨大潜力。

南洋理工大学重大突破:AI智能助手终于学会"稳扎稳打"多轮推理,不再半路"掉链子"

南洋理工大学重大突破:AI智能助手终于学会"稳扎稳打"多轮推理,不再半路"掉链子"

新加坡南洋理工大学研究团队开发的SimpleTIR方法,通过识别并过滤"无效回合"解决了AI多轮推理中的稳定性问题。该方法让AI在AIME24数学测试中的准确率从22.1分跃升至50.5分,训练过程更加稳定,并让AI自动掌握了交叉验证、渐进推理和自我纠错等高级推理模式,为开发更可靠的AI助手提供了重要技术突破。

小公司如何训练出超越巨头的AI网络助手?香港科技大学团队的"探索进化"新方案

小公司如何训练出超越巨头的AI网络助手?香港科技大学团队的"探索进化"新方案

香港科技大学团队提出WebExplorer框架,通过"模型驱动探索"和"迭代查询演化"两阶段生成高质量训练数据,成功训练出80亿参数的WebExplorer-8B模型。该模型在多个信息搜索基准测试中超越了720亿参数的大型模型,支持长达100轮的工具调用和128K上下文长度,展现了开源AI在网络助手领域的突破潜力。