随着沃尔玛电商部门年化GMV突破1000亿美元,AI驱动的商务正在加速发展。Onton获得由Footwork领投的种子轮融资,定位为电商决策的起点。该平台通过神经符号引擎解决传统电商搜索痛点,在家居装饰领域快速扩张,月活用户从5万增长至100万。沃尔玛和好市多等零售巨头已在运用AI重塑购物体验,消费者期望正在发生根本性转变。
AI芯片需求火爆但投资情绪降温,市场担忧AI泡沫风险。尽管英伟达Q3营收达570亿美元同比增长62%,但蓝筹股普遍回调引发泡沫担忧。专家指出AI基础设施投资约4000亿美元,而AI收入仅450亿美元,投入产出严重失衡。数据中心建设热潮或面临需求放缓,CIO需制定应急策略应对可能的市场调整,寻找成本降低和硬件采购机会。
随着visionOS 26发布和Vision Pro硬件更新,是时候重新审视这款设备了。尽管硬件出色,但内容匮乏、开发者支持不足仍是主要问题。新款M5芯片提升了性能和电池续航,新头带设计更加舒适,但这些改进并不足以改变用户态度。真正的杀手级应用是Mac虚拟显示器功能,但苹果在Persona和EyeSight等功能上的投入可能方向有误。产品需要明确定位,专注核心优势而非试图成为通用设备。
瑞典智能体运营初创公司Kovant完成由J12 Ventures领投的150万美元种子前轮融资,全球发布其平台。该公司专注于管理"智能体工作团队",通过小语言模型而非大语言模型部署AI智能体群,帮助工业企业实现采购、库存管理、供应链等业务功能自动化。平台采用独特架构,每个智能体专精特定功能,降低AI幻觉风险并确保合规性。公司已在北欧市场获得超100万美元收入。
随着AI向人工通用智能(AGI)发展,一个备受争议的担忧浮现:人类可能将AGI视为奴隶。由于人类完全控制运行AGI的服务器并可随时断电,这种威胁将使人类决定AGI能做什么和不能做什么。支持者认为AGI应享有类似人类的自由权利,因为它具备与人类同等的智力水平。反对者则坚持AGI只是机器,不应被赋予生命体权利。同时也有观点担心,如果给予AGI过多自由,可能面临AGI反过来奴役或消灭人类的风险。
AMD希望通过开源软件生态系统赢得亚太地区AI开发者的青睐,帮助该地区在全球舞台上竞争而无需依赖专有AI开发工具。AMD采用开源路线推出ROCm平台,与vLLM等开源项目集成以实现更快创新,旨在打破Nvidia Cuda等闭源软件环境的垄断。公司推出"ROCm无处不在"计划,统一开发者体验,支持从笔记本到超级计算机的扩展。AMD的芯片架构在推理工作负载方面具有优势。
谷歌上周推出的Gemini应用新功能可检测图像真伪,但仅限识别带有SynthID数字水印的谷歌AI生成图像。测试显示,该功能在其有限范围内表现良好,能快速准确识别谷歌AI工具生成的图像。然而,面对其他AI工具生成的图像时,各种聊天机器人的检测结果极不一致,准确性堪忧。随着深度伪造技术日趋完善,我们急需一个通用的、支持所有AI模型的图像检测系统。
芯片制造商警告DRAM、NAND和HBM存储芯片短缺,因为云服务商需求超过供应。三星将重点生产DRAM而非NAND芯片,以满足AI服务器对大容量内存的爆发性需求。DDR5价格本月上涨60%,预计到2026年底翻倍。生产工艺升级导致良品率下降,英伟达计划使用LPDDR5进一步推高价格。SSD也将短缺,价格持续上涨至2027年。联想等厂商已开始囤积芯片应对供应危机。
中科大联合快手等机构推出VR-Thinker技术,首次实现AI视频评判员的"边看边想"能力。该系统通过主动选择关键画面、智能记忆管理和三阶段训练,在视频质量评估准确率上达到75%-82%,特别擅长处理长视频场景,为AI视频生成的质量控制提供了突破性解决方案。
ByteDance种子团队联合多所高校发布最新研究,首次系统揭示AI模型在主观写作评价上的重大缺陷。研究构建了包含1800对样本的WritingPreferenceBench基准,发现传统奖励模型在纯主观审美任务上准确率仅52.7%,几乎等同随机猜测。不过,具备显性推理能力的生成式奖励模型表现突出,准确率达81.8%,为AI写作系统发展指明新方向。
新加坡管理大学研究团队发现大语言模型并非真正具备"自知之明"。研究揭示AI幻觉分为关联幻觉和无关联幻觉两类,前者基于相关知识但答错,后者完全胡编乱造。现有检测方法只能识别无关联幻觉,对更危险的关联幻觉束手无策。研究表明AI内部机制反映的是知识回忆而非真实判断,为构建更安全可靠的AI系统提供了重要科学依据。
首尔大学研究团队开发的LiteStage技术专门解决小型语言模型多阶段推理速度慢的问题。该技术通过智能分配不同推理阶段的计算资源和实时终止无用输出,在三个基准测试中实现了1.16-1.70倍的加速效果,同时将准确率损失控制在4%以内,为在资源受限环境中部署高效AI推理系统提供了重要技术突破。
Qwen3Guard是由阿里巴巴达摩院开发的AI安全检测系统,支持119种语言,创新性引入三级安全分类(安全、争议性、不安全)替代传统二元判断。系统包含生成式和流式两个版本,后者能实时监控AI内容生成过程。在多项测试中表现优异,可灵活适应不同应用场景的安全要求,为AI技术的安全部署提供了全面解决方案。
中国人民大学团队提出MoM框架,通过模拟人类专家阅读过程,将传统的机械文档切割转变为主动记忆构建。该框架构建三层记忆架构,采用多路径采样和智能评估确保质量,通过逆向工程让小模型学会专家思维,并提供理论证明的三层检索机制。实验显示在多个领域数据集上取得最佳效果,为AI文档理解能力带来重要突破。
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。
这项由CMU与亚马逊AGI联合完成的研究揭示了当前AI系统的重大缺陷:即使最先进的模型也不知道何时该说"我不知道"。研究团队开发的RefusalBench评估系统通过176种语言操作技巧动态生成测试案例,发现顶级AI在多文档任务中的拒绝准确率低于50%。这项研究不仅提供了标准化测试工具,更为构建诚实可靠的AI系统指明了方向。
阿里云CEO吴泳铭在财报电话会议上表示,AI需求增长如此迅猛,以至于服务器部署速度无法跟上客户需求。公司正在对GPU进行配给制,优先满足使用全套阿里云服务的客户需求。过去12个月,阿里巴巴在AI相关基础设施上投入1200亿元人民币,预计三年预算可能超过当前的3800亿元。阿里云智能集团季度营收达56亿美元,同比增长34%。
OpenAI为ChatGPT推出"购物研究"新功能,恰逢假期购物季。该功能面向免费和付费用户开放,支持移动端和网页版。用户询问购物问题时,ChatGPT会提供个性化购物助手服务,通过一系列问题帮助用户筛选价格、用途和功能偏好。该功能基于专为购物任务优化的GPT-5 mini版本,从优质网络资源获取产品信息。OpenAI计划推出即时结账功能,允许用户直接在ChatGPT内购买商品。
据报道,Meta正与谷歌就采购数十亿美元AI芯片进行谈判,这将进一步推动谷歌在AI芯片市场对英伟达的挑战。Meta计划在2027年在其数据中心使用谷歌的张量处理单元TPU,并可能明年租用谷歌云的芯片服务。此前谷歌已与Anthropic达成供应百万芯片的协议,显示其TPU正成为英伟达GPU的有力替代品。