最新文章
一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

在这样一个节点,一张“慢”的榜单,其发布的意义何在?

浙江大学团队破解AI图像生成大难题:让多个对象在同一张图里“听话站队“

浙江大学团队破解AI图像生成大难题:让多个对象在同一张图里“听话站队“

浙江大学研究团队开发了ContextGen,这是首个能够同时精确控制多个对象位置和外观的AI图像生成系统。该系统通过情境布局锚定和身份一致性注意力两大创新机制,解决了传统AI在多对象场景中位置控制不准确和身份保持困难的问题,并创建了业界首个10万样本的专业训练数据集,在多项测试中超越现有技术。

Google发布Nano Banana Pro最新图像生成模型

Google发布Nano Banana Pro最新图像生成模型

谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。

上海交通大学推出SR-Scientist:让AI像科学家一样自主发现数学规律

上海交通大学推出SR-Scientist:让AI像科学家一样自主发现数学规律

上海交通大学研究团队开发的SR-Scientist系统实现了人工智能在科学发现领域的重大突破。该系统能够像真正的科学家一样,从实验数据中自主发现数学公式,通过工具驱动的数据分析和长期优化机制,在四个科学领域的测试中比现有方法提高了6%-35%的精确度。这标志着AI从被动工具转变为主动科学发现者的重要里程碑。

Gemini新增AI图像检测功能,但识别能力有限

Gemini新增AI图像检测功能,但识别能力有限

谷歌为Gemini应用和网页版发布SynthID检测器,允许用户上传图像判断是否由AI生成。但该功能局限性明显,仅能识别带有谷歌SynthID水印的Gemini生成图像。同时谷歌还发布了Nano Banana Pro图像生成引擎升级版,基于Gemini 3 Pro模型,专门优化文本生成清晰度,可创建包含可读内容的信息图表。

北京大学团队首创“自我批评“算法,破解AI训练数据污染检测难题

北京大学团队首创“自我批评“算法,破解AI训练数据污染检测难题

北京大学团队提出Self-Critique方法,首次解决强化学习后训练阶段的数据污染检测难题。该方法通过让AI模型对同一问题提供不同解答思路,观察思维模式的相似性来判断数据污染。在多个模型测试中,检测准确率比传统方法提升30%,为确保AI评估公正性提供重要工具。

ChatGPT全球推出群聊功能,支持多人协作对话

ChatGPT全球推出群聊功能,支持多人协作对话

OpenAI宣布ChatGPT群聊功能正式向全球所有用户开放,涵盖免费版、Go版、Plus版和Pro版计划。该功能允许最多20人在共享对话中与ChatGPT协作,用于规划旅行、共同撰写文档、解决争议或进行研究。用户个人设置和记忆保持私密,ChatGPT能智能判断何时参与对话。这标志着OpenAI将ChatGPT从简单聊天机器人转变为社交协作平台的重要步骤。

清华大学破解AI生成图片质量难题:为什么机器画的画总有那么点“不对劲“?

清华大学破解AI生成图片质量难题:为什么机器画的画总有那么点“不对劲“?

清华大学与快手团队合作发现AI图像生成中的"噪声漂移"问题,即AI在生成过程中系统性地误判噪声水平,导致图像质量下降。他们提出的噪声感知指导(NAG)技术能实时纠正这种偏差,在标准测试中将图像质量指标FID从8.61大幅降低至2.26,且可无缝集成到现有模型中。

Google联手西屋推动核反应堆建设智能化优化方案

Google联手西屋推动核反应堆建设智能化优化方案

为应对AI数据中心激增带来的能源缺口,谷歌与西屋公司合作,计划于2030年开始建设10座核反应堆。双方开发了基于谷歌云的AI优化平台,早期测试显示可显著节约成本和时间。西屋公司此前宣布投资800亿美元建设AP1000反应堆,单座功率1150兆瓦可供750万家庭使用。新AI平台有望将反应堆建设周期从传统的10-15年缩短至5-6年。

谷歌的“谨慎权重衰减“:让AI训练更聪明的一行代码改动

谷歌的“谨慎权重衰减“:让AI训练更聪明的一行代码改动

德克萨斯大学奥斯汀分校和谷歌联合提出谨慎权重衰减(CWD),这是一种仅需修改一行代码的优化器改进方法。该技术通过条件性地应用权重衰减,只在参数更新方向与参数符号一致时施加约束,避免了传统方法的盲目约束。实验表明,CWD在3.38亿到20亿参数的语言模型和ImageNet图像分类任务上均能带来性能提升,且无需调整超参数。

Sunday公司推出家用机器人Memo,计划让机器人走进千家万户

Sunday公司推出家用机器人Memo,计划让机器人走进千家万户

人工智能机器人初创公司Sunday今日发布家用机器人Memo,专门设计用于完成日常家务。该机器人采用无腿设计,配备厚重滚动平台,可执行厨房清洁、洗碗、制作咖啡等任务。公司开发了技能捕捉手套,在500多个家庭中收集了1000万个真实家务数据用于训练。Sunday获得3500万美元融资,计划2026年底向50个家庭提供测试版本。

滑铁卢大学破解AI付费难题:LOCKET让大模型“按需付费“成为现实

滑铁卢大学破解AI付费难题:LOCKET让大模型“按需付费“成为现实

滑铁卢大学研究团队开发出LOCKET技术,解决AI服务"按需付费"的商业化难题。该技术通过创新的"适配器融合"方式替代易泄露的密码验证,实现100%有效拒绝未授权功能,同时保持已授权功能性能损失不超过7%。面对恶意攻击的成功率控制在5%以下,为AI服务提供商提供了可行的精细化定价解决方案。

邮件订阅