谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
谷歌为Gemini应用和网页版发布SynthID检测器,允许用户上传图像判断是否由AI生成。但该功能局限性明显,仅能识别带有谷歌SynthID水印的Gemini生成图像。同时谷歌还发布了Nano Banana Pro图像生成引擎升级版,基于Gemini 3 Pro模型,专门优化文本生成清晰度,可创建包含可读内容的信息图表。
OpenAI宣布ChatGPT群聊功能正式向全球所有用户开放,涵盖免费版、Go版、Plus版和Pro版计划。该功能允许最多20人在共享对话中与ChatGPT协作,用于规划旅行、共同撰写文档、解决争议或进行研究。用户个人设置和记忆保持私密,ChatGPT能智能判断何时参与对话。这标志着OpenAI将ChatGPT从简单聊天机器人转变为社交协作平台的重要步骤。
为应对AI数据中心激增带来的能源缺口,谷歌与西屋公司合作,计划于2030年开始建设10座核反应堆。双方开发了基于谷歌云的AI优化平台,早期测试显示可显著节约成本和时间。西屋公司此前宣布投资800亿美元建设AP1000反应堆,单座功率1150兆瓦可供750万家庭使用。新AI平台有望将反应堆建设周期从传统的10-15年缩短至5-6年。
人工智能机器人初创公司Sunday今日发布家用机器人Memo,专门设计用于完成日常家务。该机器人采用无腿设计,配备厚重滚动平台,可执行厨房清洁、洗碗、制作咖啡等任务。公司开发了技能捕捉手套,在500多个家庭中收集了1000万个真实家务数据用于训练。Sunday获得3500万美元融资,计划2026年底向50个家庭提供测试版本。
SkyReels是专为营销人员、设计师和社交媒体内容创作者打造的多模态生成式AI视频平台。该平台整合了Google Veo 3.1、Sora 2等顶级AI模型,支持文本转图像、图像转视频等多种工作流程。平台特色包括智能创意助手Expert Agent,通过结构化问答指导创作流程,以及150多个针对服装、消费品等领域的专业模板。SkyReels专注于TikTok、Instagram等社交平台的快速内容制作需求。
2025年5G独立组网网络持续增长,爱立信移动报告显示,已有超过90家通信服务提供商推出5G SA网络,比去年同期增加约30家。研究发现118个网络切片差异化连接服务案例,其中65个已进入商用阶段,21个于2025年推出。预计2025年底5G用户数将达29亿,占移动用户总数三分之一。移动网络数据流量同比增长20%,5G网络预计处理43%的移动数据。固定无线接入宽带服务持续增长,预计2031年全球14亿人可通过5G接入FWA宽带。
英伟达第三季度营收达570亿美元,其中数据中心业务贡献510亿美元,同比增长66%。CEO黄仁勋表示,AI推理需求因预训练、后训练和推理能力的进步而呈指数级增长。NVLink AI网络基础设施业务增长162%,营收82亿美元。公司专注于功耗比优化以降低数据中心运营成本。尽管中国市场受地缘政治影响,但英伟达致力于在全球AI计算领域保持领导地位。
维基百科编辑团队发布了一份识别AI写作的公开指南,成为目前最有效的AI文本检测资源。该指南基于2023年启动的"AI清理项目",通过分析大量编辑内容总结出AI写作的特征模式:过度强调主题重要性、使用"关键时刻"等通用表述、详述次要媒体报道以凸显重要性、频繁使用模糊的重要性声明如"强调意义"等现在分词结构,以及倾向于使用"风景如画"等营销化语言。这些特征深植于AI模型训练方式中,难以完全消除。
企业AI发展到关键节点,但多数项目在产生价值前就陷入停滞。数据科学家需要使用7-15种工具来处理数据,仍需数月时间才能获得可用状态。IDC显示仅44%的AI试点项目进入生产阶段。Hammerspace AI数据平台在NVIDIA GTC 2025上发布,通过虚拟化现有存储创建统一全局命名空间,支持多协议访问,内置向量数据库,让企业无需昂贵基础设施改造即可将现有数据转化为AI就绪资源。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
OpenAI发布了ChatGPT教师版,专门面向K-12学校教职员工,免费使用至2027年6月。该版本包含GPT-5.1 Auto无限消息功能,支持文件上传、图像生成等特性,同时符合《家庭教育权利法》要求。教师可用其创建教学材料,分享聊天记录,并获得其他教师使用建议。此前OpenAI已推出面向学生的ChatGPT Edu和学习模式功能。
企业AI已达到关键转折点,但大多数项目在产生价值前就停滞了。数据科学家需要使用7-15个工具来处理数据,仍需数月才能获得可用状态。IDC研究显示,不到44%的AI试点项目能投入生产。问题不在于算力或模型架构,而是无法在碎片化异构环境中实现数据管道的运营化。Hammerspace AI数据平台通过统一数据命名空间和自动化数据编排,解决了企业数据孤岛问题,为AI工作负载提供高性能统一数据平面。
欧盟委员会提出全面修改科技监管政策的提案,旨在减少大型科技公司面临的监管障碍。修改内容包括:允许AI公司访问共享个人数据进行模型训练、简化小企业审批流程、将AI监管集中至AI办公室、推迟高风险AI应用的严格规定实施。此外,备受诟病的Cookie横幅将被重新设计,减少弹出频率并支持一键同意。该提案现已提交欧洲议会审批,可能面临质疑声音。
人工智能为已经过度充斥内容的社交媒体世界增添更多燃料。AI的大规模生产能力让内容泛滥问题更加严重,同时算法操控也变得更加可疑。在广告领域,AI工具可能彻底改变传统广告模式,通过智能代理的受托责任替代常见广告形式。未来AI甚至可能使用人类的AI化身代笔写书,模仿其声音、历史和个性。这引发了关于人类作者身份和写作本质的深刻思考。
欧洲零售巨头金士佛决定放弃SAP推荐的S/4HANA升级路径,转而将ECC系统迁移至谷歌云并采用第三方支持。面对2027年SAP停止ECC支持的截止期限,全球仅39%的ECC客户已购买S/4HANA许可证。金士佛通过谷歌云和第三方服务实现了AI创新,质疑了SAP"创新胡萝卜"策略的必要性。但这一决定可能导致失去未来与SAP谈判的商业优势。
分布式计算初创公司Taho完成350万美元种子轮融资,目标是替代Kubernetes成为人工智能工作负载的主要编排和调度层。该公司由来自Meta、谷歌和Snap的基础设施资深人员创建,声称其计算框架可将工作负载处理时间提升最多100%,同时大幅降低成本。Taho开发了高性能联邦计算框架,通过替换复杂的基础设施软件来提高AI硬件效率。
谷歌DeepMind团队开发的AI系统AlphaProof在2024年国际数学奥林匹克竞赛中获得银牌水平表现。该系统结合神经网络、搜索算法和测试时强化学习,能够理解数学结构并进行形式化证明。团队使用Lean编程语言训练AI翻译和验证数学陈述,创建了8000万个形式化数学问题的数据库。虽然计算成本高昂且需要几天时间解决问题,但这标志着AI在高级数学推理方面的重大突破。
Gartner预测,人工智能需求激增正推动全球数据中心市场增长,对全球电力供需模式产生双重影响。数据中心电力需求今年将增长16%,到2030年将翻倍。预计2025年全球数据中心电力消耗将达448太瓦时,2030年升至980太瓦时。AI优化服务器今年将占数据中心总功耗的21%,2030年将升至44%。美国和中国将占全球数据中心电力需求的三分之二以上。