图像生成 关键字列表
Google正式关闭Pixel Studio应用,引导用户转向Gemini生成图像

Google正式关闭Pixel Studio应用,引导用户转向Gemini生成图像

谷歌正式关闭旗下AI图像生成应用Pixel Studio,距其首次亮相不足两年。随着最新版本v2.3的推出,应用主界面已被替换为"打开Gemini"按钮,并提示用户通过Gemini应用中的Nano Banana功能继续创建图片和动画。用户此前的创作内容仍可在应用内查看。Pixel Studio最初随Pixel 9系列手机推出,曾陆续新增Gboard集成、人物生成及生成式AI编辑等功能,如今全面停止服务。

亚马逊用AI生成虚假商品图片,这真的有必要吗?

亚马逊用AI生成虚假商品图片,这真的有必要吗?

亚马逊在其购物应用中推出新功能:当用户在搜索栏输入关键词时,AI将实时生成与描述匹配的商品图片——但这些图片对应的商品并不真实存在。亚马逊称此举旨在弥合"想象"与"商品发现"之间的鸿沟。然而批评者认为,用AI凭空生成不存在的商品图片不仅浪费算力资源,更会让消费者在找不到对应商品时感到困惑。此外,亚马逊还同步推出AI购物拼贴、以图搜索、"更多同款"及Amazon Lens Live等多项新功能。

微软全新AI图像工具在关键评测中超越谷歌Nano Banana

微软全新AI图像工具在关键评测中超越谷歌Nano Banana

微软在Build开发者大会上发布了两款新文生图模型——MAI-Image-2.5与Flash版本,同时还推出了首个推理模型MAI-Thinking-1及多款语音、转录和代码模型,共七款新AI模型。根据Arena AI排行榜评测,MAI-Image-2.5在图像编辑能力上已超越谷歌Nano Banana 2,但仍位居OpenAI GPT-Image-2之后。新图像模型现已集成至PowerPoint、Foundry企业市场及OneDrive,主打精准编辑与专业级输出能力。

让AI生成自己的提示词,图像效果立竿见影

让AI生成自己的提示词,图像效果立竿见影

想提升AI图像生成质量?一个实用技巧是:先让聊天机器人为你设计专属的图像生成提示词,再将其用于对应的图像生成器。只需提供基本描述,让AI自动补充细节,生成更完整、精准的提示词。经测试,Gemini和ChatGPT均能返回远超用户自行编写的详细描述,图像生成效果明显更好。此外,由AI生成的提示词还能有效规避内容审核限制,让生成过程更顺畅。

马丁·斯科塞斯成为好莱坞最新AI代言人

马丁·斯科塞斯成为好莱坞最新AI代言人

好莱坞著名导演马丁·斯科塞斯已正式成为AI图像生成初创公司Black Forest Labs的合伙人兼顾问。他表示,将该技术用于故事板创作,帮助他更高效地向摄影师和制作设计师传达创作构想。Black Forest Labs总部位于德国弗莱堡,拥有70名员工,估值达32.5亿美元,其技术已被Adobe、Canva、微软和Meta采用。此举被视为好莱坞对AI态度逐渐软化的最新信号。

Google Pixel 新增"Disco"自定义图标包,风格独树一帜

Google Pixel 新增"Disco"自定义图标包,风格独树一帜

谷歌Pixel手机推出全新"迪斯科"图标包,为应用图标赋予迪斯科球效果。该设计灵感源自社交媒体上的"discomorphism"风格讨论。新图标包采用黑色背景配合镜面球效果,与此前推出的"涂鸦""饼干""星尘"等AI生成图标风格一同提供个性化选择,支持不同色彩方案定制。

iOS 27中Apple Intelligence图像模型将迎来重大视觉升级

iOS 27中Apple Intelligence图像模型将迎来重大视觉升级

据Mark Gurman最新报道,苹果将在iOS 27中对Genmoji和Image Playground所使用的图像生成模型进行大幅视觉质量提升。自iOS 18.2推出以来,Image Playground的图像质量一直备受诟病。此次升级中,苹果不仅改进了自有模型,还将在Image Playground中引入第三方AI图像生成模型支持,除现有的ChatGPT外,预计还将扩展至谷歌等竞争对手的模型。

Google宣布推出AI设计应用Pics,剑指Canva市场

Google宣布推出AI设计应用Pics,剑指Canva市场

谷歌在2026年Google I/O大会上宣布推出Pics——一款面向Google Workspace用户的AI驱动设计与图像生成应用。该应用由Gemini提供编辑支持,用户只需输入文字提示即可生成社交媒体图像、邀请函、营销素材等内容,无需专业设计技能。Pics支持对生成图像的局部精细修改,可直接点击元素进行编辑,操作类似Google Docs评论功能。该应用将于今夏向Google AI Ultra订阅用户正式推出。

图像AI模型发布成移动应用增长新引擎,下载量是聊天机器人更新的6.5倍

图像AI模型发布成移动应用增长新引擎,下载量是聊天机器人更新的6.5倍

据应用智能机构Appfigures报告显示,图像模型的发布正成为AI移动应用增长的核心驱动力,带来的下载量是传统模型更新的6.5倍。ChatGPT和Gemini在推出各自图像模型后,均新增数千万下载。其中,Gemini图像模型发布后28天内新增逾2200万次下载;ChatGPT的GPT-4o图像模型发布后新增超1200万次安装。然而,下载量激增并不必然转化为收入,仅ChatGPT成功将关注度转化为约7000万美元的实际消费。

我用ChatGPT Images 2.0重新设计了应用界面,效果令人惊叹

我用ChatGPT Images 2.0重新设计了应用界面,效果令人惊叹

OpenAI发布的ChatGPT Images 2.0不只是一个图像生成工具,它具备了主题理解能力,能够接收设计任务并输出高价值成果。作者将两款正在开发中的应用界面截图上传至ChatGPT,仅用几分钟便获得了经过重新设计的UI方案,其中包含多项可直接落地的设计改进建议。对于独立开发者而言,这相当于以每月20美元的成本获得了专业设计团队的评审与原型输出。

ChatGPT图像2.0在印度大受欢迎,全球市场反应仍偏温和

ChatGPT图像2.0在印度大受欢迎,全球市场反应仍偏温和

OpenAI最新发布的ChatGPT图像2.0在印度迅速走红,成为该功能最大用户市场。印度用户主要将其用于创作个人头像、艺术肖像及奇幻主题图像等自我表达内容。然而,第三方数据显示全球整体反响较为平淡,应用下载量周环比仅增长11%,日活跃用户和网页流量增幅约为1%至1.6%。巴基斯坦、越南、印度尼西亚等新兴市场出现较大增幅,部分地区下载量周环比最高飙升79%。

Google TV 迎来更多 Gemini 功能,YouTube Shorts 登陆主屏幕

Google TV 迎来更多 Gemini 功能,YouTube Shorts 登陆主屏幕

谷歌宣布为Google TV推出新一批AI功能,核心是扩展Gemini能力。用户可通过"创建"按钮体验图像生成模型Nano Banana和视频生成工具Veo,前者支持语音指令修改照片,后者可将静态图片生成动态视频片段。Google Photos也获得Gemini加持,支持语义搜索和艺术风格滤镜。此外,YouTube Shorts将直接出现在Google TV主屏幕,谷歌暗示未来可能引入更多短视频平台内容。

ChatGPT Images 2.0 与 Gemini Nano Banana 图像生成能力深度横评

ChatGPT Images 2.0 与 Gemini Nano Banana 图像生成能力深度横评

作者对ChatGPT Images 2.0与Google Gemini Nano Banana进行了全面横向测评。测试涵盖30项指标,ChatGPT Images 2.0以97%的得分领先,Gemini Nano Banana获85%,较去年93%明显下滑。ChatGPT在人脸保真度、文字生成和图像还原方面表现更优;而Gemini则暴露出一个令人担忧的问题——在未经请求的情况下,将用户聊天历史中的私人信息嵌入生成图像,引发隐私安全顾虑。

我亲测ChatGPT Images 2.0:功能飞跃,真正能用于实际工作

我亲测ChatGPT Images 2.0:功能飞跃,真正能用于实际工作

OpenAI正式发布ChatGPT图像2.0,相较前代实现重大突破——从生成简单"装饰图"跃升至支持包含详细文字的全页图形创作。作者通过品牌信息图、手绘笔记等多项实测发现,新版本在文字准确性和品牌风格还原方面表现突出,可为企业提供切实的商业价值。但测试也暴露出首次生成时存在数据错误等问题,整体仍需多轮提示修正才能达到理想效果。

ComfyUI估值达5亿美元,创作者争夺AI生成内容控制权

ComfyUI估值达5亿美元,创作者争夺AI生成内容控制权

ComfyUI是一款基于节点工作流的AI创作工具,帮助创作者精细控制扩散模型生成的图像、视频和音频内容。该公司近日完成3000万美元新一轮融资,估值达5亿美元,由Craft Ventures领投。ComfyUI于2023年以开源项目起步,目前已拥有超过400万用户,广泛应用于视觉特效、动画、广告及工业设计领域。相比提示词工具,其节点式界面让创作者对生成过程拥有更全面的掌控力。

ChatGPT Images 2发布:OpenAI关闭Sora后为何重返图像领域

ChatGPT Images 2发布:OpenAI关闭Sora后为何重返图像领域

OpenAI正式发布新一代图像生成模型ChatGPT Images 2,主打文字密集型图像创作,涵盖信息图表、科学海报、学习指南及营销素材等场景。新模型在排版、图标设计和构图方面均有提升,支持多语言文字渲染,并向API开发者开放2K和4K分辨率生成功能。此举标志着OpenAI正将生成式媒体能力聚焦于"具备经济价值的创意任务",进一步完善其超级应用布局。

ChatGPT图像2.0上线:具备联网搜索与多图生成能力

ChatGPT图像2.0上线:具备联网搜索与多图生成能力

OpenAI正式推出ChatGPT Images 2.0,新增"思考能力",可联网搜索辅助创作。付费用户启用思考模式后,可根据单个提示词生成最多8张风格统一的图像,支持上传文件生成可视化说明。新版本图像分辨率提升至2K,支持3:1至1:3等多种比例,并在日、韩、中、印地语等非拉丁文字的图像文本生成方面实现显著提升。该功能现已向所有ChatGPT用户开放。

OpenAI推出ChatGPT图像2.0及Codex Labs开发者培训服务

OpenAI推出ChatGPT图像2.0及Codex Labs开发者培训服务

OpenAI正式推出ChatGPT Images 2.0,支持最高2000像素宽度及多种宽高比,显著提升图像质量,包括多语言文字渲染、小型界面元素生成等。付费用户可通过"思考"和"专业"推理模式接入网络数据,并支持单次生成最多10张图像。此外,OpenAI还发布企业级服务Codex Labs,帮助企业部署Codex编程助手,提供培训工作坊及工具集成支持。

ChatGPT Images 2.0 图像模型:文字生成能力大幅提升

ChatGPT Images 2.0 图像模型:文字生成能力大幅提升

OpenAI推出ChatGPT Images 2.0图像生成模型,最大亮点是其出色的文字渲染能力。两年前,AI图像模型在生成含文字内容时频繁出错,如今Images 2.0已能生成可直接商用的高质量图像。该模型具备"思考能力",支持网页搜索、一键生成多张图片及自动校验功能,并对日韩文、印地语等非拉丁文字有更强的支持,最高分辨率可达2K。所有ChatGPT及Codex用户将于本周二起可使用该模型,付费用户可解锁更高级输出,API接口同步开放。

Gemini现可接入谷歌相册,生成个性化图像

Gemini现可接入谷歌相册,生成个性化图像

谷歌个人智能功能现已升级,允许Gemini接入谷歌相册数据,结合Nano Banana 2图像模型,根据用户个人偏好和生活方式生成定制化图像。用户可通过"设计我的梦想住宅"等提示词触发该功能,系统将自动识别相册中的人物标签并生成相关图像。谷歌表示不会直接用私人相册训练AI模型,但会使用部分提示词及模型响应数据。该功能将在未来几天内向美国AI Plus、Pro及Ultra订阅用户推出。