图像生成文章列表第1页-至顶网频道

2026-06-08

Google正式关闭Pixel Studio应用，引导用户转向Gemini生成图像

谷歌正式关闭旗下AI图像生成应用Pixel Studio，距其首次亮相不足两年。随着最新版本v2.3的推出，应用主界面已被替换为"打开Gemini"按钮，并提示用户通过Gemini应用中的Nano Banana功能继续创建图片和动画。用户此前的创作内容仍可在应用内查看。Pixel Studio最初随Pixel 9系列手机推出，曾陆续新增Gboard集成、人物生成及生成式AI编辑等功能，如今全面停止服务。

人工智能

图像生成

AI购物体验创新

2026-06-04

亚马逊用AI生成虚假商品图片，这真的有必要吗？

亚马逊在其购物应用中推出新功能：当用户在搜索栏输入关键词时，AI将实时生成与描述匹配的商品图片——但这些图片对应的商品并不真实存在。亚马逊称此举旨在弥合"想象"与"商品发现"之间的鸿沟。然而批评者认为，用AI凭空生成不存在的商品图片不仅浪费算力资源，更会让消费者在找不到对应商品时感到困惑。此外，亚马逊还同步推出AI购物拼贴、以图搜索、"更多同款"及Amazon Lens Live等多项新功能。

人工智能

图像生成

模型评测

2026-06-04

微软全新AI图像工具在关键评测中超越谷歌Nano Banana

微软在Build开发者大会上发布了两款新文生图模型——MAI-Image-2.5与Flash版本，同时还推出了首个推理模型MAI-Thinking-1及多款语音、转录和代码模型，共七款新AI模型。根据Arena AI排行榜评测，MAI-Image-2.5在图像编辑能力上已超越谷歌Nano Banana 2，但仍位居OpenAI GPT-Image-2之后。新图像模型现已集成至PowerPoint、Foundry企业市场及OneDrive，主打精准编辑与专业级输出能力。

人工智能

图像生成

提示词优化

2026-06-03

让AI生成自己的提示词，图像效果立竿见影

想提升AI图像生成质量？一个实用技巧是：先让聊天机器人为你设计专属的图像生成提示词，再将其用于对应的图像生成器。只需提供基本描述，让AI自动补充细节，生成更完整、精准的提示词。经测试，Gemini和ChatGPT均能返回远超用户自行编写的详细描述，图像生成效果明显更好。此外，由AI生成的提示词还能有效规避内容审核限制，让生成过程更顺畅。

人工智能

图像生成

行业应用

2026-06-03

马丁·斯科塞斯成为好莱坞最新AI代言人

好莱坞著名导演马丁·斯科塞斯已正式成为AI图像生成初创公司Black Forest Labs的合伙人兼顾问。他表示，将该技术用于故事板创作，帮助他更高效地向摄影师和制作设计师传达创作构想。Black Forest Labs总部位于德国弗莱堡，拥有70名员工，估值达32.5亿美元，其技术已被Adobe、Canva、微软和Meta采用。此举被视为好莱坞对AI态度逐渐软化的最新信号。

人工智能

图像生成

AI个性化定制

2026-05-25

Google Pixel 新增"Disco"自定义图标包，风格独树一帜

谷歌Pixel手机推出全新"迪斯科"图标包，为应用图标赋予迪斯科球效果。该设计灵感源自社交媒体上的"discomorphism"风格讨论。新图标包采用黑色背景配合镜面球效果，与此前推出的"涂鸦""饼干""星尘"等AI生成图标风格一同提供个性化选择，支持不同色彩方案定制。

人工智能

图像生成

模型升级

2026-05-25

iOS 27中Apple Intelligence图像模型将迎来重大视觉升级

据Mark Gurman最新报道，苹果将在iOS 27中对Genmoji和Image Playground所使用的图像生成模型进行大幅视觉质量提升。自iOS 18.2推出以来，Image Playground的图像质量一直备受诟病。此次升级中，苹果不仅改进了自有模型，还将在Image Playground中引入第三方AI图像生成模型支持，除现有的ChatGPT外，预计还将扩展至谷歌等竞争对手的模型。

人工智能

图像生成

AI设计应用

2026-05-20

Google宣布推出AI设计应用Pics，剑指Canva市场

谷歌在2026年Google I/O大会上宣布推出Pics——一款面向Google Workspace用户的AI驱动设计与图像生成应用。该应用由Gemini提供编辑支持，用户只需输入文字提示即可生成社交媒体图像、邀请函、营销素材等内容，无需专业设计技能。Pics支持对生成图像的局部精细修改，可直接点击元素进行编辑，操作类似Google Docs评论功能。该应用将于今夏向Google AI Ultra订阅用户正式推出。

人工智能

图像生成

应用增长分析

2026-05-07

图像AI模型发布成移动应用增长新引擎，下载量是聊天机器人更新的6.5倍

据应用智能机构Appfigures报告显示，图像模型的发布正成为AI移动应用增长的核心驱动力，带来的下载量是传统模型更新的6.5倍。ChatGPT和Gemini在推出各自图像模型后，均新增数千万下载。其中，Gemini图像模型发布后28天内新增逾2200万次下载；ChatGPT的GPT-4o图像模型发布后新增超1200万次安装。然而，下载量激增并不必然转化为收入，仅ChatGPT成功将关注度转化为约7000万美元的实际消费。

人工智能

图像生成

UI设计优化

2026-05-06

我用ChatGPT Images 2.0重新设计了应用界面，效果令人惊叹

OpenAI发布的ChatGPT Images 2.0不只是一个图像生成工具，它具备了主题理解能力，能够接收设计任务并输出高价值成果。作者将两款正在开发中的应用界面截图上传至ChatGPT，仅用几分钟便获得了经过重新设计的UI方案，其中包含多项可直接落地的设计改进建议。对于独立开发者而言，这相当于以每月20美元的成本获得了专业设计团队的评审与原型输出。

人工智能

图像生成

新品发布资讯

2026-05-06

ChatGPT图像2.0在印度大受欢迎，全球市场反应仍偏温和

OpenAI最新发布的ChatGPT图像2.0在印度迅速走红，成为该功能最大用户市场。印度用户主要将其用于创作个人头像、艺术肖像及奇幻主题图像等自我表达内容。然而，第三方数据显示全球整体反响较为平淡，应用下载量周环比仅增长11%，日活跃用户和网页流量增幅约为1%至1.6%。巴基斯坦、越南、印度尼西亚等新兴市场出现较大增幅，部分地区下载量周环比最高飙升79%。

Google TV 迎来更多 Gemini 功能，YouTube Shorts 登陆主屏幕

人工智能

图像生成

新功能发布

2026-04-30

Google TV 迎来更多 Gemini 功能，YouTube Shorts 登陆主屏幕

谷歌宣布为Google TV推出新一批AI功能，核心是扩展Gemini能力。用户可通过"创建"按钮体验图像生成模型Nano Banana和视频生成工具Veo，前者支持语音指令修改照片，后者可将静态图片生成动态视频片段。Google Photos也获得Gemini加持，支持语义搜索和艺术风格滤镜。此外，YouTube Shorts将直接出现在Google TV主屏幕，谷歌暗示未来可能引入更多短视频平台内容。

人工智能

图像生成

对比测试

2026-04-28

ChatGPT Images 2.0 与 Gemini Nano Banana 图像生成能力深度横评

作者对ChatGPT Images 2.0与Google Gemini Nano Banana进行了全面横向测评。测试涵盖30项指标，ChatGPT Images 2.0以97%的得分领先，Gemini Nano Banana获85%，较去年93%明显下滑。ChatGPT在人脸保真度、文字生成和图像还原方面表现更优；而Gemini则暴露出一个令人担忧的问题——在未经请求的情况下，将用户聊天历史中的私人信息嵌入生成图像，引发隐私安全顾虑。

人工智能

图像生成

图像内容准确性

2026-04-27

我亲测ChatGPT Images 2.0：功能飞跃，真正能用于实际工作

OpenAI正式发布ChatGPT图像2.0，相较前代实现重大突破——从生成简单"装饰图"跃升至支持包含详细文字的全页图形创作。作者通过品牌信息图、手绘笔记等多项实测发现，新版本在文字准确性和品牌风格还原方面表现突出，可为企业提供切实的商业价值。但测试也暴露出首次生成时存在数据错误等问题，整体仍需多轮提示修正才能达到理想效果。

人工智能

图像生成

节点式工作流

2026-04-27

ComfyUI估值达5亿美元，创作者争夺AI生成内容控制权

ComfyUI是一款基于节点工作流的AI创作工具，帮助创作者精细控制扩散模型生成的图像、视频和音频内容。该公司近日完成3000万美元新一轮融资，估值达5亿美元，由Craft Ventures领投。ComfyUI于2023年以开源项目起步，目前已拥有超过400万用户，广泛应用于视觉特效、动画、广告及工业设计领域。相比提示词工具，其节点式界面让创作者对生成过程拥有更全面的掌控力。

ChatGPT Images 2发布：OpenAI关闭Sora后为何重返图像领域

人工智能

图像生成

新型图像模型

2026-04-22

ChatGPT Images 2发布：OpenAI关闭Sora后为何重返图像领域

OpenAI正式发布新一代图像生成模型ChatGPT Images 2，主打文字密集型图像创作，涵盖信息图表、科学海报、学习指南及营销素材等场景。新模型在排版、图标设计和构图方面均有提升，支持多语言文字渲染，并向API开发者开放2K和4K分辨率生成功能。此举标志着OpenAI正将生成式媒体能力聚焦于"具备经济价值的创意任务"，进一步完善其超级应用布局。

人工智能

图像生成

多图批量生成

2026-04-22

ChatGPT图像2.0上线：具备联网搜索与多图生成能力

OpenAI正式推出ChatGPT Images 2.0，新增"思考能力"，可联网搜索辅助创作。付费用户启用思考模式后，可根据单个提示词生成最多8张风格统一的图像，支持上传文件生成可视化说明。新版本图像分辨率提升至2K，支持3:1至1:3等多种比例，并在日、韩、中、印地语等非拉丁文字的图像文本生成方面实现显著提升。该功能现已向所有ChatGPT用户开放。

人工智能

图像生成

多功能升级

2026-04-22

OpenAI推出ChatGPT图像2.0及Codex Labs开发者培训服务

OpenAI正式推出ChatGPT Images 2.0，支持最高2000像素宽度及多种宽高比，显著提升图像质量，包括多语言文字渲染、小型界面元素生成等。付费用户可通过"思考"和"专业"推理模式接入网络数据，并支持单次生成最多10张图像。此外，OpenAI还发布企业级服务Codex Labs，帮助企业部署Codex编程助手，提供培训工作坊及工具集成支持。

人工智能

图像生成

自回归模型

2026-04-22

ChatGPT Images 2.0 图像模型：文字生成能力大幅提升

OpenAI推出ChatGPT Images 2.0图像生成模型，最大亮点是其出色的文字渲染能力。两年前，AI图像模型在生成含文字内容时频繁出错，如今Images 2.0已能生成可直接商用的高质量图像。该模型具备"思考能力"，支持网页搜索、一键生成多张图片及自动校验功能，并对日韩文、印地语等非拉丁文字有更强的支持，最高分辨率可达2K。所有ChatGPT及Codex用户将于本周二起可使用该模型，付费用户可解锁更高级输出，API接口同步开放。

人工智能

图像生成

个性化图像生成

2026-04-17

Gemini现可接入谷歌相册，生成个性化图像

谷歌个人智能功能现已升级，允许Gemini接入谷歌相册数据，结合Nano Banana 2图像模型，根据用户个人偏好和生活方式生成定制化图像。用户可通过"设计我的梦想住宅"等提示词触发该功能，系统将自动识别相册中的人物标签并生成相关图像。谷歌表示不会直接用私人相册训练AI模型，但会使用部分提示词及模型响应数据。该功能将在未来几天内向美国AI Plus、Pro及Ultra订阅用户推出。

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: