智能白板制造商Vibe发布桌面AI设备Vibe Bot,集成语音助手、智能摄像头和AI笔记功能。该设备采用圆柱形设计,配备4K摄像头、波束成形麦克风和可旋转屏幕,能够跟踪发言者并自动调整视角。支持在线和离线会议录音,提供实时转录和AI生成的会议纪要,用户可通过语音助手查询会议信息并触发日历等应用操作。
Razer的Project Ava项目推出桌面全息投影版本,采用5.5英寸动漫角色形象,能通过内置摄像头监控屏幕内容和用户行为。该AI助手可回答问题、提供游戏建议、协助解决问题,甚至给出穿搭建议。用户可通过自定义按键与助手对话,目前使用Grok大语言模型驱动。Razer计划今年底推出该产品并接受预订。
人工智能(AI),尤其是生成式 AI(GenAI),正在改变各类行业的“游戏规则”。麦肯锡研究显示,生成式AI有望为全球贡献约7万亿美元的经济价值,并将AI的整体影响提高近50%。
英伟达提前发布新一代Vera Rubin计算平台,该平台由六个芯片组成,包括Vera CPU、Rubin GPU等核心组件。Rubin GPU的AI训练计算能力比前代Blackwell提升五倍,整个架构在训练大型AI模型时仅需四分之一的GPU数量,成本降至七分之一。该平台支持第三代机密计算,将成为首个机架级可信计算平台,预计2026年下半年开始提供服务。
多数CIO已明白工作重点是提供商业价值而非系统运行时间。随着生成式AI等新机遇每两年涌现一次,IT能否持续交付价值成为关键。常见问题包括员工流失、技术合作伙伴期望落差、安全优先级平衡和技术债务处理。专家指出七个扼杀IT商业价值的做法:大爆炸式部署、缺乏部署计划的AI概念验证、只关注部署忽视采用、规定未来工作方式、部署AI时加速技术债务、接受无后续支持的一次性项目,以及学习投资不足。
借助 FlexPLM 基于AI的技术包生成功能,团队可以自动从设计图中提取数据,并即时填充物料清单(BOM)、尺寸规格、结构细节、产品属性以及配色方案等关键信息。通过消除人工数据录入,品牌能够显著减少错误、降低开发成本,加快打样和成本核算速度,并更迅速地响应不断变化的市场需求。
超过二十年前,记者尼古拉斯·卡尔在《哈佛商业评论》中提出IT是商品化服务,缺乏竞争优势,这一争议再次成为焦点。当前由AI和自动化推动的技术变革中,许多企业领导者将技术决策推给IT部门,然后对结果不满。问题的核心在于组织未能构建让技术成功的环境。企业需要三个转变:将基础IT服务视为公用设施,在传统IT外构建数字和AI能力,让业务领导者对技术成果负责。
企业不仅能精准掌握碳足迹,更能在运营中产生可量化的商业价值,真正将可持续性从“理念”变为“行动”。
剑桥大学研究团队首次系统探索AI在多轮对话中的信心判断问题。研究发现当前AI系统在评估自己答案可靠性方面存在严重缺陷,容易被对话长度而非信息质量误导。团队提出P(SUFFICIENT)等新方法,但整体问题仍待解决。该研究为AI在医疗、法律等关键领域的安全应用提供重要指导,强调了开发更可信AI系统的紧迫性。
威斯康星大学研究团队开发出Prithvi-CAFE洪水监测系统,通过"双视觉协作"机制解决了AI地理基础模型在洪水识别上的局限性。该系统巧妙融合全局理解和局部细节能力,在国际标准数据集上创造最佳成绩,参数效率提升93%,为全球洪水预警和防灾减灾提供了更准确可靠的技术方案。
华为研究团队提出CPPO方法,解决视觉语言模型中感知与推理能力混淆的问题。该方法通过熵变化自动识别依赖视觉信息的词汇,采用三元组对比学习优化感知能力,在多个基准测试中显著提升了AI的视觉理解准确性,为多模态AI训练提供了新的精细化能力管理方案。
人工智能可能并非完全处于泡沫状态,但大语言模型可能确实存在泡沫。他指出,尽管AI基础设施投资巨大,但开源模型在性能上已接近商业前沿模型,且成本更低。Zemlin预测2026年将迎来以开放生态系统为主导的"性能与效率时代",并强调PARK技术栈将成为AI部署的默认平台。
在 CES 2026 上,全新的 DGX Spark 软件版本结合新的模型更新和开源库,为 DGX Spark 以及基于 GB10 的 OEM 系统带来了显著的性能提升。
哈佛大学等机构研发的ORION模型通过"心智语言"技术,让AI推理效率提升5倍、成本降低9倍,同时保持90-98%的准确率。该技术模仿人类简洁思维模式,用符号化表达替代冗长推理,在数学问题求解中实现了4-16倍的文字压缩,为AI实用化部署开辟新路径。
帝国理工学院研究团队开发出突破性分层控制系统,解决装备额外机械臂的仿人机器人行走稳定性难题。通过"分工合作"策略,低层控制器负责基础行走,高层控制器指挥机械臂动态平衡,实验显示机器人行走模式与正常状态相似度提高47%,为多功能机器人应用奠定技术基础。
这是一项关于用户引导视频场景理解的突破性研究。加州大学圣巴巴拉分校团队开发了Click2Graph系统,用户只需在视频中点击一次,系统就能自动追踪目标对象,发现相关互动物体,并预测它们之间的关系,生成完整场景图谱。该系统创新性地结合了交互式分割和语义推理,为机器人、自动驾驶等领域提供了可控制、可解释的视频理解解决方案。
这项由中国上海巨人网络AI实验室完成的研究,开发了名为YingVideo-MV的AI系统,能够仅凭一张人物照片、一段音乐和简单文字描述,自动生成专业水准的音乐视频。系统首次实现了音频分析、人物动画和摄像机运动的统一控制,通过智能导演模块进行全局规划,采用分阶段制作流程确保质量。测试结果显示,生成视频在口型同步、视觉质量和用户满意度方面都达到了接近专业制作的水平,为音乐视频制作的民主化开辟了新道路。
NVIDIA 于1月6日在 CES 2026 展示了 DGX Spark 桌面级AI 超级计算机如何让开发者在本地桌面级系统上使用最新的开源与前沿 AI 模型。
阿里巴巴达摩院团队开发的BlockVid系统突破了AI视频生成的技术瓶颈,首次实现了分钟级连贯视频的高质量生成。该系统通过语义稀疏KV缓存、块强制训练策略和分块噪声调度等创新技术,有效解决了长视频生成中的累积误差问题。在专门构建的LV-Bench评估基准上,BlockVid在主体一致性和画面清晰度等关键指标上分别提升了22.2%和19.4%,显著超越现有技术,为AI视频生成领域带来重要突破。
北京邮电大学等机构联合发布的GUI智能体研究突破了传统界面导航技术瓶颈。通过创新的GE-Lab模拟环境和三阶段渐进训练方法,成功让AI获得类人的界面操作能力,在复杂导航任务中表现出色,为智能助手和数字化辅助技术发展奠定重要基础。