人工智能 关键字列表
中科大联手快手:AI视频评判员学会了"边看边想",彻底解决视频生成质量难题

中科大联手快手:AI视频评判员学会了"边看边想",彻底解决视频生成质量难题

中科大联合快手等机构推出VR-Thinker技术,首次实现AI视频评判员的"边看边想"能力。该系统通过主动选择关键画面、智能记忆管理和三阶段训练,在视频质量评估准确率上达到75%-82%,特别擅长处理长视频场景,为AI视频生成的质量控制提供了突破性解决方案。

ByteDance种子团队揭秘:AI写作判断为何如此困难,连最强模型都败给了"主观感受"

ByteDance种子团队揭秘:AI写作判断为何如此困难,连最强模型都败给了"主观感受"

ByteDance种子团队联合多所高校发布最新研究,首次系统揭示AI模型在主观写作评价上的重大缺陷。研究构建了包含1800对样本的WritingPreferenceBench基准,发现传统奖励模型在纯主观审美任务上准确率仅52.7%,几乎等同随机猜测。不过,具备显性推理能力的生成式奖励模型表现突出,准确率达81.8%,为AI写作系统发展指明新方向。

AI大模型真的知道自己不知道什么吗?新加坡管理大学揭开ChatGPT们的"自知之明"真相

AI大模型真的知道自己不知道什么吗?新加坡管理大学揭开ChatGPT们的"自知之明"真相

新加坡管理大学研究团队发现大语言模型并非真正具备"自知之明"。研究揭示AI幻觉分为关联幻觉和无关联幻觉两类,前者基于相关知识但答错,后者完全胡编乱造。现有检测方法只能识别无关联幻觉,对更危险的关联幻觉束手无策。研究表明AI内部机制反映的是知识回忆而非真实判断,为构建更安全可靠的AI系统提供了重要科学依据。

首尔大学LiteStage突破:让小语言模型快如闪电的多阶段推理加速器

首尔大学LiteStage突破:让小语言模型快如闪电的多阶段推理加速器

首尔大学研究团队开发的LiteStage技术专门解决小型语言模型多阶段推理速度慢的问题。该技术通过智能分配不同推理阶段的计算资源和实时终止无用输出,在三个基准测试中实现了1.16-1.70倍的加速效果,同时将准确率损失控制在4%以内,为在资源受限环境中部署高效AI推理系统提供了重要技术突破。

Qwen团队推出AI安全卫士:能实时识别有害内容,支持119种语言的智能守护神

Qwen团队推出AI安全卫士:能实时识别有害内容,支持119种语言的智能守护神

Qwen3Guard是由阿里巴巴达摩院开发的AI安全检测系统,支持119种语言,创新性引入三级安全分类(安全、争议性、不安全)替代传统二元判断。系统包含生成式和流式两个版本,后者能实时监控AI内容生成过程。在多项测试中表现优异,可灵活适应不同应用场景的安全要求,为AI技术的安全部署提供了全面解决方案。

人民大学团队提出MoM框架:让AI像人类专家一样"读书",把文档变成结构化记忆

人民大学团队提出MoM框架:让AI像人类专家一样"读书",把文档变成结构化记忆

中国人民大学团队提出MoM框架,通过模拟人类专家阅读过程,将传统的机械文档切割转变为主动记忆构建。该框架构建三层记忆架构,采用多路径采样和智能评估确保质量,通过逆向工程让小模型学会专家思维,并提供理论证明的三层检索机制。实验显示在多个领域数据集上取得最佳效果,为AI文档理解能力带来重要突破。

AI新加坡联手阿里云推出东南亚大语言模型Sea-Lion v4

AI新加坡联手阿里云推出东南亚大语言模型Sea-Lion v4

新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。

5个将在2026年改变任何企业的惊人智能体应用案例

5个将在2026年改变任何企业的惊人智能体应用案例

AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。

AI拒绝答题"考试":CMU与亚马逊携手打造语言模型检测器,防止AI胡编乱造误导人类

AI拒绝答题"考试":CMU与亚马逊携手打造语言模型检测器,防止AI胡编乱造误导人类

这项由CMU与亚马逊AGI联合完成的研究揭示了当前AI系统的重大缺陷:即使最先进的模型也不知道何时该说"我不知道"。研究团队开发的RefusalBench评估系统通过176种语言操作技巧动态生成测试案例,发现顶级AI在多文档任务中的拒绝准确率低于50%。这项研究不仅提供了标准化测试工具,更为构建诚实可靠的AI系统指明了方向。

阿里云服务器部署速度跟不上AI需求,GPU配给优先大客户

阿里云服务器部署速度跟不上AI需求,GPU配给优先大客户

阿里云CEO吴泳铭在财报电话会议上表示,AI需求增长如此迅猛,以至于服务器部署速度无法跟上客户需求。公司正在对GPU进行配给制,优先满足使用全套阿里云服务的客户需求。过去12个月,阿里巴巴在AI相关基础设施上投入1200亿元人民币,预计三年预算可能超过当前的3800亿元。阿里云智能集团季度营收达56亿美元,同比增长34%。

ChatGPT推出AI购物助手 生成个性化买家指南功能

ChatGPT推出AI购物助手 生成个性化买家指南功能

OpenAI为ChatGPT推出"购物研究"新功能,恰逢假期购物季。该功能面向免费和付费用户开放,支持移动端和网页版。用户询问购物问题时,ChatGPT会提供个性化购物助手服务,通过一系列问题帮助用户筛选价格、用途和功能偏好。该功能基于专为购物任务优化的GPT-5 mini版本,从优质网络资源获取产品信息。OpenAI计划推出即时结账功能,允许用户直接在ChatGPT内购买商品。

Google与英伟达AI芯片竞争升级,Meta寻求合作

Google与英伟达AI芯片竞争升级,Meta寻求合作

据报道,Meta正与谷歌就采购数十亿美元AI芯片进行谈判,这将进一步推动谷歌在AI芯片市场对英伟达的挑战。Meta计划在2027年在其数据中心使用谷歌的张量处理单元TPU,并可能明年租用谷歌云的芯片服务。此前谷歌已与Anthropic达成供应百万芯片的协议,显示其TPU正成为英伟达GPU的有力替代品。

Mercy Ships与Presidio、思科携手推动海上医疗数字化变革

Mercy Ships与Presidio、思科携手推动海上医疗数字化变革

慈善船舶组织运营两艘大型医院船在非洲为低收入社区提供医疗服务。面对海上网络覆盖差、延迟高、断网频繁等挑战,思科与合作伙伴Presidio共同设计了冗余数据中心和无线网络解决方案。项目包括部署1600部思科电话、多个交换机堆叠和语音系统,并计划引入AI技术和本地化计算能力,为偏远地区提供可靠的远程医疗服务。

南洋理工大学团队发布NEO:从零开始构建真正意义上的"原生"视觉语言模型

南洋理工大学团队发布NEO:从零开始构建真正意义上的"原生"视觉语言模型

新加坡南洋理工大学团队开发的NEO模型颠覆了传统视觉语言AI的设计思路,从模块化拼接转向原生统一架构。仅用3.9亿图文配对数据就实现了与大型模块化系统相媲美的性能,证明了端到端训练的有效性,为AI系统设计开辟了新路径。

谷歌AI再创突破:让计算机像真正的图书管理员一样智能检索信息

谷歌AI再创突破:让计算机像真正的图书管理员一样智能检索信息

谷歌联合德克萨斯大学等机构开发出LATTICE框架,这是一种革命性的信息检索系统,能像智能图书管理员一样工作。它将文档组织成语义树结构,用AI推理能力进行智能导航搜索,在复杂查询任务上比传统方法准确率提高9%以上。该系统无需训练即可适应新领域,为未来智能搜索指明了方向。

多轮AI智能体的强化学习新突破:蚂蚁集团信息增益优化方法让AI学会更聪明地搜索和推理

多轮AI智能体的强化学习新突破:蚂蚁集团信息增益优化方法让AI学会更聪明地搜索和推理

蚂蚁集团等机构联合提出IGPO方法,解决多轮AI智能体训练中的奖励稀疏问题。该方法通过信息增益为每个交互轮次提供密集反馈,避免传统方法中的"优势坍塌"现象。在七个数据集上的实验表明,IGPO显著超越现有方法,平均提升4.8分,对小型模型改进尤为显著。该研究为多轮推理AI训练提供了新思路。

华盛顿大学研究团队突破性发现:不要扔掉你的预训练模型,多模型协作让AI更聪明

华盛顿大学研究团队突破性发现:不要扔掉你的预训练模型,多模型协作让AI更聪明

华盛顿大学研究团队发现,AI模型训练过程中产生的"中间产品"不应被丢弃,而应通过协作发挥价值。他们开发的"切换生成"技术让预训练、微调和对齐模型像接力赛一样协作回答问题,在18个任务中的16个表现超越单一模型,平均提升12.9%性能,能解决单个模型无法处理的复杂问题,为AI发展提供了"集体智慧"的新思路。

香港中大团队推出MathCanvas:AI终于学会了画图解题!

香港中大团队推出MathCanvas:AI终于学会了画图解题!

香港中文大学团队开发了MathCanvas框架,首次让AI具备了"边画边想"的数学推理能力。该系统通过两阶段训练让AI学会生成和编辑数学图形,并在解题中战略性运用视觉工具。在包含3000道题目的测试中,性能相比基础模型提升86%,特别是几何类问题改进显著。这项突破不仅推进了AI数学推理能力,也为多模态AI发展提供了新方向。

AI和物联网技术变革宠物预防性医疗保健

AI和物联网技术变革宠物预防性医疗保健

英国宠物慈善机构PDSA数据显示,超过半数宠物主担心无法承担兽医费用。科技公司正通过AI和物联网技术解决这一市场需求。在伦敦兽医展上,多家初创公司展示了创新技术:AI for Pet利用视觉AI分析宠物眼部、皮肤等图像提供健康洞察;Sylvester.ai开发AI模型识别猫咪疼痛表情;VEA整合患者数据自动化诊断。此外,智能项圈等物联网设备可追踪宠物健康症状。这些技术有助于宠物主采取预防措施,降低兽医费用。

北欧国家联合打造AI产业:微软谷歌成关键推手

北欧国家联合打造AI产业:微软谷歌成关键推手

北欧国家启动统一人工智能产业计划,旨在通过合作在全球舞台上竞争,获得微软和谷歌支持。10月成立的新北欧AI中心获得350万英镑初始预算,但谷歌和微软是唯一提供资金支持的科技公司,具体金额保密。该中心将开发生成式AI系统并建设应用AI服务的系统。北欧教育部长承诺追加资金开发大型北欧语言生成AI模型。尽管资金有限,但北欧国家希望通过联合力量在AI竞赛中提升地位。