STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。
伊尔德兹技术大学团队通过词典手术和离线蒸馏,以不足20美元成本打造出专为土耳其语优化的200M参数句子嵌入模型,在语义相似度任务上超越了参数量更大的原版教师模型。
LongLive-RAG由英伟达、USC与MIT联合提出,通过让AI检索自身生成的历史视频片段作为参考,解决长视频生成中的角色漂移和画面不一致问题。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
Cloudflare联合创始人兼CEO马修·普林斯近日表示,AI智能体产生的网络流量已首次超越人类用户,这一里程碑比多数人预期的更早到来。普林斯原本预测该转折点将出现在2027年底或2027年初,但AI智能体流量增长之迅猛远超预期。这一现象也为"死亡互联网"理论提供了新的佐证——该理论认为互联网上的大部分内容和活动已由机器人主导。
Mentium Technologies宣布,其新一代AI处理芯片Luna-R1已被选用于EarthTraq开发的ET-01低轨卫星星座任务,该任务获得NASA小型航天器与分布式系统项目支持。四颗卫星将搭载SpaceX Transporter-17发射,每颗均配备Luna-R1计算板。该芯片支持在轨实时AI推理、异常检测与分布式协同处理,可降低延迟并提升星座整体运营效率。此外,Mentium正研发下一代加速器Luna-2,算力达4.2 TOPS,功耗仅150毫瓦。
马里兰大学提出无需训练奖励模型的数学推理方案,用大模型实时为小模型的分块生成过程打分选优,效果媲美专用过程奖励模型。
上交大等机构联合构建首个个性化MCP工具测评平台,测试超十款顶尖AI在飞书、小红书等真实个人账号场景的实际能力,结果显示无一模型准确率超过50%。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生与腾讯AI首席科学家姚顺雨在2026腾讯云AI产业应用大会的对谈,话题又聚焦了一些,聊的是“腾讯AI下半场”。
Mind Lab提出三轴PEFT框架,通过增强共享基础模型、缩小个人适配器、扩展持久化适配器种群,探索百万个人AI模型的可行路径。
K-BROWSECOMP是一套专门测试AI在韩语网络中多步搜索推理能力的基准测试集,包含400道题,揭示全球顶尖AI模型在韩语环境下存在严重性能下滑,韩国本土模型得分更低至0%至10%。
浙江大学团队提出目标视角复现任务(TVR),测试AI主动导航至指定视角的能力,最强模型成功率仅12%,人类达93%,并验证了视觉示范学习与多轮强化学习的提升路径。
这项研究提出"VLM即教师"框架,让视觉语言模型在视频生成推理时充当实时监考官,通过可微分奖励信号在线优化轻量LoRA模块,平均提升视频推理性能16.7分。
这项来自新加坡科学技术研究局的研究提出了κ-SwiGLU,通过路由确信度动态调整专家门控灵敏度,在多种MoE模型上稳定提升性能,新增计算开销不足4%。
研究系统揭示多智能体LLM工作流强化学习训练的成败规律:独立策略峰值更高但易崩溃,共享策略失败更隐蔽,根源在角色梯度动力学。
清华大学等机构提出JAMEL框架,通过代码覆盖率信号联合训练AI智能体的潜在记忆模块与探索策略,以极低token消耗实现媲美大型闭源模型的自主探索能力。
卡内基梅隆大学提出MACU框架,让经理AI统筹多个员工AI并行完成复杂电脑操作任务,通过动态调整任务图,在四个基准上均超越单智能体。
专注推动网络与安全融合的全球性综合网络安全解决方案供应商Fortinet(R)(NASDAQ:FTNT)旗下FortiGuard Labs(FortiGuard全球威胁研究与响应实验室),近日重磅发布《2026年全球威胁态势研究报告》。