谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
慕尼黑大学联合多所知名院校的研究团队发现,AI深度研究助手虽然能力强大,但存在严重安全漏洞。通过"计划注入"和"意图劫持"两种新攻击方法,这些AI助手可能绕过安全防护,生成比普通AI更详细、更危险的有害内容。研究测试了六款主流AI模型,发现在医学等敏感领域风险尤其突出。团队开发了新的安全评估框架并提出多层防护建议。
谷歌为Gemini应用和网页版发布SynthID检测器,允许用户上传图像判断是否由AI生成。但该功能局限性明显,仅能识别带有谷歌SynthID水印的Gemini生成图像。同时谷歌还发布了Nano Banana Pro图像生成引擎升级版,基于Gemini 3 Pro模型,专门优化文本生成清晰度,可创建包含可读内容的信息图表。
牛津大学研究团队发现了针对AI推理安全系统的四种"黑科技"攻击方法,能以超过90%的成功率让最先进的安全防护失效。这些方法利用AI对话模板的结构性缺陷,从简单的符号插入到复杂的推理劫持,门槛极低但威力巨大。研究揭示了当前AI安全架构的根本性问题,特别是在开源AI时代,这些漏洞的影响范围前所未有。
OpenAI宣布ChatGPT群聊功能正式向全球所有用户开放,涵盖免费版、Go版、Plus版和Pro版计划。该功能允许最多20人在共享对话中与ChatGPT协作,用于规划旅行、共同撰写文档、解决争议或进行研究。用户个人设置和记忆保持私密,ChatGPT能智能判断何时参与对话。这标志着OpenAI将ChatGPT从简单聊天机器人转变为社交协作平台的重要步骤。
Google DeepMind团队公开了SynthID-Image系统的完整技术细节和部署经验。该系统已为超过100亿张AI图像添加不可见水印,实现互联网规模的内容溯源。研究详细阐述了水印技术的核心原理、质量保持方法、鲁棒性设计和安全防护策略,并分享了从实验室技术转向大规模实际部署的宝贵经验,为AI内容溯源技术的产业化应用提供重要参考。
为应对AI数据中心激增带来的能源缺口,谷歌与西屋公司合作,计划于2030年开始建设10座核反应堆。双方开发了基于谷歌云的AI优化平台,早期测试显示可显著节约成本和时间。西屋公司此前宣布投资800亿美元建设AP1000反应堆,单座功率1150兆瓦可供750万家庭使用。新AI平台有望将反应堆建设周期从传统的10-15年缩短至5-6年。
KAIST团队提出TAG(时间对齐引导)技术,解决扩散模型在接受外部指导时容易偏离正轨的问题。通过训练时间预测器判断样本时间状态,TAG能主动将偏差样本拉回正确轨道,显著提升生成质量。实验显示该方法在图像生成、音频处理、分子设计等多领域均有显著改进,为AI生成技术的实用化提供重要突破。
人工智能机器人初创公司Sunday今日发布家用机器人Memo,专门设计用于完成日常家务。该机器人采用无腿设计,配备厚重滚动平台,可执行厨房清洁、洗碗、制作咖啡等任务。公司开发了技能捕捉手套,在500多个家庭中收集了1000万个真实家务数据用于训练。Sunday获得3500万美元融资,计划2026年底向50个家庭提供测试版本。
这项由北卡罗来纳大学教堂山分校完成的研究提出了ONELIFE框架,让AI仅通过一次无引导的游戏探索就能学会复杂虚拟世界的运行规律。系统将世界理解为可编程法则的组合,通过法则合成器和推理算法自动发现并评估这些规律。在Crafter-OO环境的23个测试场景中,ONELIFE在16个场景超越现有方法,并成功用于实际决策规划,为开发快速适应新环境的自主AI系统奠定了基础。
PHP 8.5正式发布,引入了期待已久的管道操作符和符合标准的URI解析器。管道操作符支持函数调用链式操作,让代码更具可读性,避免冗余变量和嵌套语句。新增的URI扩展基于RFC 3986和WHATWG URL标准,为开发者提供标准化的URI解析功能。此外还包括Clone With属性更新、NoDiscard属性警告等特性。
西安交大与微软联合提出PART方法,巧妙解决AI推理过程展示与知识产权保护的矛盾。通过移除自言自语行为和重排推理结构,该方法在保持人类可读性的同时有效阻止模型蒸馏,使偷学模型性能下降6-13%,为AI行业提供了创新的技术保护方案。