AI第四代生成式AI标志着技术范式转变,正在用户体验、应用自动化和平台三个层面为企业带来重大价值和颠覆。企业应关注商业价值而非技术本身,需要从业务问题出发量化价值。未来五年将在认知任务处理上取得巨大进展,但需要创新思维应对劳动力转型。六大颠覆性支柱包括下一代AI能力、数据平台、机器人技术、量子计算、企业用户体验和云架构等。
本文分析了AI向AGI发展的七大路径中的S曲线路径,该路径预测AI发展将经历三个阶段:2025-2030年AI多模态模型和智能体技术快速发展;2030-2035年进入停滞平台期,引发AI寒冬担忧;2035-2040年技术突破重新启动,自改进AI系统和混合认知架构推动AGI最终实现。
谷歌周四宣布,通过Gemini应用为其Veo 3 AI视频生成器增加图像生成视频功能。该功能此前已在5月I/O开发者大会上推出的AI视频工具Flow中提供。目前Veo 3视频生成功能已在150多个国家推出,仅限Google AI Ultra和Pro用户使用,每日限制生成3个视频。用户可上传照片并添加音频描述来生成视频。发布7周来,用户已创建超过4000万个视频,所有视频都带有可见和不可见的数字水印。
微软研究团队提出"AI绿色推理"新模式,将AI计算集群直接部署在风电场等可再生能源站点,绕过电网瓶颈直接利用绿色能源。该方案通过Heron软件路由器动态管理工作负载,根据实时电力供应情况智能分配计算任务。研究显示,目前可在风电场部署超过600万个高端GPU。这种模块化数据中心架构不仅缓解传统电网压力,还能有效利用未充分使用的可再生能源,为云计算提供商提供可持续发展的新路径。
文章介绍了AI大语言模型中最新的深度研究功能,这是目前最令人印象深刻的新功能之一。作者详细解析了ChatGPT、Claude和Gemini等主流模型的使用方法,并重点展示了深度研究功能的实际应用。通过实际测试,作者用ChatGPT 4.5的深度研究功能生成了一份关于1990-2025年最令人厌烦歌曲的详细报告,展示了AI如何通过思维链进行深度研究和分析。文章还提到了语音交互模式将进一步改变用户与AI的交互体验。
随着AI引发投资热潮,越来越多初创企业获得独角兽地位。TechCrunch追踪了今年迄今为止成为独角兽的风投支持初创企业。虽然大多数与AI相关,但令人惊讶的是许多企业专注于其他行业,如卫星公司Loft Orbital和区块链交易网站Kalshi。名单涵盖软件开发、机器人技术、企业网络基础设施、体育软件、客服AI代理等多个领域,估值从10亿美元到100亿美元不等。
德国TNG Technology Consulting公司基于DeepSeek R1-0528开发出新变体R1T2 Chimera,采用专家组装技术融合三个预训练模型。该模型在保持90%原版推理能力的同时,输出token数量减少60%,推理速度提升200%。新模型采用MIT开源许可,已在Hugging Face平台发布,为企业应用提供更高效的AI推理解决方案。
MIT、哈佛和芝加哥大学研究人员提出"波将金理解"概念,用于描述大语言模型的新型失效模式。这些模型在概念基准测试中表现优异,但缺乏实际应用这些概念的真正理解能力。研究显示,模型能准确解释概念定义,却无法正确识别、生成或编辑相关实例。测试发现模型概念识别准确率达94.2%,但在实际应用中失败率高达40-55%。这种现象使基准测试结果产生误导性,表明AI距离真正的通用人工智能还有很长路要走。
Cerabyte公司表示,到2030年将推出容量超过100PB的归档存储机架,带宽达2GBps,首字节访问时间少于10秒。该技术基于飞秒激光在玻璃基板上蚀刻陶瓷记录层,玻璃片存储在类似磁带的盒式存储器中。与磁带相比,该技术寿命超过100年,成本仅1美元/TB,数据传输速度1-2GBps。公司已获得Pure Storage等投资,正在开发试点生产系统。
Linux之父Linus Torvalds警告称,新一代bcachefs文件系统可能在6.17版本内核中被移除。争议源于bcachefs维护者Kent Overstreet在发布候选阶段提交了包含新功能的代码,违反了该阶段只能修复漏洞的规则。Torvalds对此表示不满,并暗示双方将"分道扬镳"。bcachefs项目历时十年发展,刚于2024年1月纳入6.7版本内核,现在面临被踢出的风险。即使被移除,该项目仍可通过外部开发、FUSE子系统或DKMS工具等方式继续发展。
人工智能与量子技术正在改变传统心脏诊疗方式。SandboxAQ首席执行官介绍了一种突破性方法,通过量子传感器检测心脏磁场替代传统心电图的电场检测。这种新技术能够获得360度完整、高密度的心脏信息,避免传统心电图间接检测导致的误诊问题。该方法结合AI和量子计算,为心血管疾病提供更精准的个性化诊断和治疗方案。
Genspark推出超级智能体,将"氛围编程"概念扩展至企业工作流程,实现"氛围工作"模式。该系统采用9个大语言模型的专家混合架构,配备80多种工具和10多个数据集,通过规划-执行-观察-回溯循环运行。系统能自主处理复杂业务任务,甚至代替用户拨打电话。45天内实现3600万美元年收入,展现了自主智能体平台的商业可行性,挑战传统企业AI架构理念。
人工智能平台提供商Aquant推出"检索增强对话"(RAC)新技术,改变大语言模型信息检索和呈现方式。与传统检索增强生成(RAG)一次性提供完整答案不同,RAC采用逐步对话模式,像领域专家一样通过提问填补知识空白,生成定制化解决方案。该技术能整合手册、交易数据、作业历史等多种数据源,在成本、风险和时间之间找到最佳平衡,预计两年内成为AI检索指导的主要机制。
微软在Copilot+ PC发布一年后,推出了Windows AI Foundry取代Windows Copilot Runtime,支持开发者在更广泛的PC设备上部署AI模型。大会还宣布WSL开源、推出高级Windows设置工具,并优化Microsoft Store体验,包括为个人开发者免费注册。微软正从单纯依赖NPU转向CPU、GPU协同加速的策略,致力于构建更完整的AI生态系统,推动Windows平台在AI时代的发展。
谷歌DeepMind推出实验性研究模型Gemini Diffusion,采用扩散方法生成文本,打破传统大语言模型依赖自回归逐词生成的模式。该技术从随机噪声开始,逐步细化为连贯输出,显著提升生成速度至每秒1000-2000个令牌,是Gemini 2.5 Flash的3-7倍。扩散模型支持并行处理、自我纠错和非因果推理,在编程和数学任务中表现出色。虽然在多语言和推理能力上仍有差距,但该技术为实时对话AI、代码辅助等低延迟应用带来巨大潜力,标志着语言模型架构的重要变革。
文章论述了开源 AI 推动网络安全变革的方法,探讨了通过治理、自动化、目的型工具贡献、总拥有成本管理及风险防控五大战略,实现安全合规与持续增长。
Meta本周发布了名为V-JEPA 2的开源生成式AI模型,该模型能够帮助人工智能理解重力和物体永恒性等物理概念。与依赖标记数据或视频模拟现实的传统模型不同,V-JEPA 2强调物理世界的逻辑,包括物体如何移动和相互作用。该模型可应用于自动驾驶汽车和机器人等设备,无需针对每种可能情况进行训练,简化了流程并提高了现实应用的效率。
苹果研究表明,模拟推理模型在高难度问题上多依赖模式匹配而非真正推理,这与 USAMO 最新发现不谋而合。
Commvault 在其平台上新增 HQC 算法,以补充 ML-KEM 可能存在的安全隐患,旨在为客户提供“先采集数据后解密”的全方位保护。
Mary Meeker 的报告详细解析了 AI 技术在数据、训练与商业应用上的飞速增长,展现了 ChatGPT 等产品快速超越传统搜索的趋势,预示着未来各领域都将迎来全面变革。