人工智能 关键字列表
OpenAI推出ChatGPT Pulse 主动生成个性化晨报

OpenAI推出ChatGPT Pulse 主动生成个性化晨报

OpenAI发布ChatGPT新功能Pulse,可在用户睡眠期间生成个性化报告,提供5-10条简报帮助用户快速了解当日重要信息。该功能旨在让用户像查看社交媒体一样优先使用ChatGPT。Pulse首先向每月200美元的Pro订阅用户开放,未来计划扩展至所有用户。功能支持连接Gmail、日历等应用,可解析邮件、生成日程安排。报告以卡片形式展示,包含AI生成的图像和文本,涵盖新闻摘要、个性化建议等内容。

Clarifai新推理引擎让AI模型运行速度翻倍成本降低40%

Clarifai新推理引擎让AI模型运行速度翻倍成本降低40%

AI平台公司Clarifai发布新推理引擎,声称能让AI模型运行速度提升一倍,成本降低40%。该系统采用多种优化技术,从CUDA内核到高级推测解码,能在相同硬件上获得更强推理性能。第三方测试显示其在吞吐量和延迟方面创下行业最佳记录。该产品专门针对推理过程优化,特别适用于需要多步骤响应的智能体和推理模型。

Harness推出智能体担任DevOps任务管理者

Harness推出智能体担任DevOps任务管理者

在伦敦Unscripted大会上,DevOps公司Harness展示了最新AI驱动模块,包括AI管道构建器、AI测试自动化、构建失败时的自主代码修复、AI应用安全和AI混沌测试等。该公司指出,软件团队仅有30-40%时间用于规划编码,其余时间消耗在测试、安全、部署和优化上。CEO表示,通过专用AI智能体分解任务并相互验证输出,结合组织上下文知识,可有效减少AI幻觉问题。

韩国芯片初创公司FuriosaAI推出服务器产品挑战GPU霸主地位

韩国芯片初创公司FuriosaAI推出服务器产品挑战GPU霸主地位

韩国芯片初创公司FuriosaAI推出NXT RNGD服务器,搭载该公司自研的AI推理神经处理芯片。该服务器在本地数据中心和私有云环境中相比GPU解决方案具有更高效率和更低成本。公司瞄准银行、金融、教育和电商等企业客户,希望通过开源和自研软件的组合提供一体化解决方案,挑战英伟达在AI推理市场的主导地位。

Liquid AI发布超小型高性能基础模型,专为设备端处理设计

Liquid AI发布超小型高性能基础模型,专为设备端处理设计

AI初创公司Liquid AI发布名为"Nanos"的突破性小型AI模型,参数规模在3.5亿到26亿之间,可在手机、笔记本和嵌入式设备上本地运行。该模型在专门任务上可达到GPT-4o级别性能,支持多语言翻译、数据提取、数学推理等功能。公司采用"液态神经网络"架构,使模型能以极小体积提供前沿级性能,实现设备端AI处理,确保隐私安全并降低成本。

Databricks与OpenAI达成1亿美元合作,简化企业AI智能体部署

Databricks与OpenAI达成1亿美元合作,简化企业AI智能体部署

Databricks和OpenAI宣布建立多年期1亿美元合作伙伴关系,将OpenAI最新模型(包括GPT-5)原生集成到Databricks数据智能平台,服务全球超2万家客户。该协议旨在简化企业AI代理部署,使企业能够在其治理数据之上直接构建生产就绪的AI应用。通过Agent Bricks开发环境的紧密集成,组织可在单一平台上开发、评估和扩展AI代理系统,无需复杂的数据迁移或独立工具管理,同时确保数据安全性和合规性要求。

Solidigm为PS1010 SSD产品线新增E1.S液冷版本

Solidigm为PS1010 SSD产品线新增E1.S液冷版本

Solidigm发布了PS1010系列E1.S规格液冷SSD,采用单面冷板技术实现双面散热,专为高密度AI工作负载设计。该产品支持热插拔,相比同类产品能耗降低33%,提供3.84TB和7.68TB容量选择,是目前最快的PCIe 5.0直连存储SSD之一。

DeepMind推出RoboBallet:让制造机器人实现自主协调的AI系统

DeepMind推出RoboBallet:让制造机器人实现自主协调的AI系统

谷歌DeepMind团队开发出名为RoboBallet的AI系统,能让制造业机器人自主规划作业流程。该系统通过图神经网络技术,同时解决任务分配、调度安排和运动规划三大难题,将复杂的机器人协调问题转化为图形数据处理。在测试中,RoboBallet能在几秒内为8台机器人规划出高效的作业轨迹,执行效果接近人工工程师水平但速度更快,有望大幅提升工厂自动化编程效率。

2025魔搭社区MCP&Agent挑战赛落幕:20支进入决赛的团队角逐AMD创新赛道,端侧智能体应用百花齐放

参赛项目包括《AI儿童陪伴系统》《机械零件工艺知识智能体》《端侧多模态医疗险理赔智能体》等多个具有实际应用价值的智能体解决方案。

谷歌DeepMind重磅研究:AI智能体经济体如何重塑人类社会运作模式

谷歌DeepMind重磅研究:AI智能体经济体如何重塑人类社会运作模式

这项由谷歌DeepMind研究团队完成的开创性研究首次系统阐述了AI智能体经济的概念框架。研究提出"沙盒经济"模型,从起源性质和边界渗透性两个维度分析AI智能体经济形态,预测未来将出现自然涌现且高度透水的AI经济网络。研究详细探讨了科学加速、机器人协调、个人助手等应用场景,提出基于拍卖机制的公平资源分配方案和使命经济概念,并深入分析了技术基础设施需求、社区货币应用以及相关风险防范措施。

人工智能遇上"偏科生"难题:中国人民大学团队让AI在不平衡世界中也能公平学习

人工智能遇上"偏科生"难题:中国人民大学团队让AI在不平衡世界中也能公平学习

中国人民大学研究团队提出LoFT方法,通过参数高效微调基础模型解决长尾半监督学习中的数据不平衡问题。该方法利用预训练模型的良好校准特性改进伪标签质量,并扩展出LoFT-OW版本处理开放世界场景。实验显示,仅使用传统方法1%的数据量就能取得更优性能,为AI公平性和实用性提供了新的解决方案。

AI模型"千里之堤毁于蚁穴":剑桥大学团队揭示大语言模型长期任务执行的致命缺陷

AI模型"千里之堤毁于蚁穴":剑桥大学团队揭示大语言模型长期任务执行的致命缺陷

剑桥大学等机构研究发现,AI模型在长期任务执行中存在致命缺陷:微小的单步改进会带来指数级的长期能力提升,但传统模型会被自己的历史错误"带偏",出现自我设限效应。思考型模型如GPT-5能执行超过1000步任务,打破了这一限制。研究重新定义了AI价值评估标准,认为长期执行能力比单次交互表现更重要。

香港科技大学等联合提出InfGen:让AI图像生成告别分辨率限制,10秒内生成4K高清图片

香港科技大学等联合提出InfGen:让AI图像生成告别分辨率限制,10秒内生成4K高清图片

香港科技大学等研究机构联合提出InfGen,一种革命性的AI图像生成方法。该技术将内容生成与分辨率调整分离,通过固定尺寸的潜在表示配合专门的生成器,实现任意分辨率图像的快速生成。相比传统方法需要100秒生成4K图像,InfGen将时间缩短至10秒内,速度提升10倍以上。该方法具备即插即用特性,可直接升级现有扩散模型,为高分辨率图像生成提供了全新解决方案。

史丹福大学团队打造AI"股市福尔摩斯",四个智能助手联手预测股价走势

史丹福大学团队打造AI"股市福尔摩斯",四个智能助手联手预测股价走势

史丹福大学团队开发出名为QuantAgent的AI股票预测系统,由四个专业AI助手协作:技术指标分析师、图形识别专家、趋势分析师和风险管理师。该系统仅通过分析股价数据就能预测市场走向,在比特币、标普500等八种资产的测试中,预测准确率普遍超过随机水平,最高达到80%。该研究展示了人工智能在高频交易领域的突破性应用。

中科大团队的惊人突破:让AI学会像人一样熟练使用工具!

中科大团队的惊人突破:让AI学会像人一样熟练使用工具!

中科大研究团队针对新兴MCP协议环境开发了首个专业AI评估基准MCP-AgentBench,包含33个服务器188种工具和600道测试题目。研究发现开源模型表现优异,通义千问达到64.7%最高得分超越专有模型,揭示了交互框架对性能的关键影响,为AI工具使用能力评估建立了新标准。

这个AI"学霸"掌握了万物规律:清华团队让大语言模型变身超级数据分析师

这个AI"学霸"掌握了万物规律:清华团队让大语言模型变身超级数据分析师

中科院大学等机构联合开发的MachineLearningLM突破了大语言模型在数据分析方面的局限。该系统通过300万个合成任务的训练,能够在看到数百个例子后自动掌握各种数据预测规律。测试显示,它在金融、医疗等领域的分析准确率显著超越传统模型,同时保持了优秀的语言理解能力,为实现真正的通用人工智能分析系统开辟了新路径。

ServiceNow推出音频大模型评估神器:AI语音助手测评从此不再头疼

ServiceNow推出音频大模型评估神器:AI语音助手测评从此不再头疼

ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议,将评估效率提升127%,涵盖19项测试任务。研究引入了两个全新测试类别:时间感知的对话分离和复杂的口语推理能力。通过380多项测试揭示,当前AI语音模型在基础识别方面表现良好,但在复杂推理和时间理解上仍存在显著差距,为未来技术改进指明了方向。

约翰霍普金斯大学推出MMBERT:一个会说1800多种语言的AI模型

约翰霍普金斯大学推出MMBERT:一个会说1800多种语言的AI模型

约翰霍普金斯大学研究团队开发了MMBERT多语言AI模型,采用渐进式学习策略训练超过1800种语言。该模型通过逆向掩码调度和温度采样等创新技术,在多项基准测试中超越XLM-R等现有模型,甚至在部分小语种任务上超过OpenAI o3和Google Gemini。模型运行速度比同类产品快2-4倍,已开源发布。

华为研究团队首创3D空间理解基准测试:让AI像人类一样理解多视角世界

华为研究团队首创3D空间理解基准测试:让AI像人类一样理解多视角世界

华为科技团队开发出首个多视角3D空间理解基准测试Ego3D-Bench,包含8600个测试样本,覆盖距离测量、定位、运动推理等任务。同时推出Ego3D-VLM解决方案,通过构建文字版认知地图显著提升AI空间理解能力,多选题准确率提升12%,距离估算误差减少56%,为自动驾驶和机器人应用提供关键技术支撑。

香港大学团队打造首个牙科全景X光智能分析系统,AI医生能看懂你的口腔健康吗?

香港大学团队打造首个牙科全景X光智能分析系统,AI医生能看懂你的口腔健康吗?

香港大学团队构建了全球首个大规模牙科全景X光AI数据集MMOral,包含2万余张影像和130万条指令数据。研究发现现有AI模型在牙科诊断上表现不佳,最强的GPT-4o仅达41%准确率。团队开发的专业模型OralGPT经训练后准确率提升24.73%,为AI在牙科医学的应用奠定基础。