图像处理文章列表第2页-至顶网频道

2026-02-12

Facebook推出AI功能：可为头像和动态添加动画效果

Facebook正在推出新的AI功能，让用户可以将静态头像制作成动画效果，并为Stories和Memories提供重新设计选项。用户可以通过预设动画让照片做出挥手、戴派对帽等动作。该功能建议使用面向镜头的单人照片效果最佳。此外，用户还可以为文字帖子添加动画背景，让内容在信息流中更加醒目。这是Meta让Facebook重新获得文化相关性努力的一部分。

Facebook推出AI动画头像和文字帖背景功能

Facebook发布多项AI驱动的新功能，包括动画头像、照片重新设计工具和文本帖子动画背景。动画头像功能可为静态照片添加挥手、比心等动作效果。Stories和Memories新增"Restyle"工具，用户可通过文本提示或预设主题重新设计上传图片的外观风格。此外，用户还可为文本帖子添加落叶、海浪等动画背景。这些更新旨在为年轻用户提供更个性化的体验。

Google Photos 支持文本提示生成视频功能

谷歌相册推出文字提示功能，用户可通过描述性文本指导图片转视频的生成效果，包括动作、风格和特效等。该功能补充了原有的"细微动作"和"随机生成"选项，提供更精准的创作控制。新功能仅限18岁以上用户使用，同时支持默认添加音频，生成可直接发布的视频内容。

Photoshop AI工具全面升级：更高分辨率输出，更精准控制

Adobe为Photoshop新增三个无损可遮罩调整图层：清晰度、去雾和颗粒效果，帮助创作者精确调整纹理、深度和细节。生成填充参考图像功能升级，可更准确保持物体身份特征。基于改进的Firefly模型，生成填充、扩展和移除工具现支持2K分辨率输出，细节更清晰，瑕疵更少。新增动态文本测试版，可轻松将文本转换为圆形、弧形等形状。

利用生成式AI为老照片上色和修复

珍贵的老照片和家庭纪念品往往因岁月侵蚀而褪色损坏，传统的照片修复和上色技术既耗时又需要专业技能。现在，借助生成式AI技术，普通用户也能轻松让老照片重焕生机。文章介绍了使用Adobe Firefly等AI工具的完整流程：首先将照片数字化，然后选择合适的AI系统，逐步进行上色和修复。过程中需要提供详细指令、进行多次优化，并分阶段处理严重损坏的照片，以获得最佳效果。

苹果宣布专业图像编辑应用Pixelmator Pro即将登陆iPad

苹果宣布Pixelmator Pro将于1月28日在iPad平台推出，为用户带来桌面级设计体验。新版本集成了完整的图层侧边栏、智能选择工具、高级位图和矢量蒙版等专业功能。借助苹果芯片深度整合，应用支持超分辨率照片放大、去条带压缩等AI功能。完全支持Apple Pencil，提供压感笔刷和像素级精准设计。需要A16、A17 Pro或M1及更新芯片的设备运行。

特伦托大学最新突破：AI换脸技术的"反向操作"让身份匿名化成为可能

意大利特伦托大学联合芬兰奥卢大学开发的"反向个性化"技术，通过巧妙的AI逆向操作实现了高质量的人脸匿名化。该技术使用负向引导机制，让AI在保留表情、姿势等关键信息的同时有效去除身份特征，并支持用户精确控制需要保留或修改的面部属性。相比传统方法，该技术无需专门训练即可处理任意人物照片，在身份去除效果、属性保留质量和图像质量方面都实现了显著提升，为医疗、教育、社交媒体等领域的隐私保护提供了新的解决方案。

人工智能

图像处理

儿童教育应用

2025-12-24

Splat应用利用AI将照片转换为儿童涂色页面

Retro团队开发的Splat应用通过生成式AI技术，将用户拍摄的照片或从相册选择的图片转换为儿童涂色页。用户可选择动漫、3D电影、漫画等风格，AI会快速生成可打印或屏幕涂色的页面。应用提供动物、太空、花卉等教育分类，采用订阅制收费模式，每周4.99美元或年费49.99美元。

图像处理

网络技术

格式标准化

2025-11-11

PDF协会选择JPEG XL作为首选图像格式

PDF协会在欧洲会议上宣布，将在PDF规范中添加对JPEG XL图像格式的支持。尽管Chromium团队此前将该格式标记为过时，但此次纳入可能为JXL带来主流应用机会。PDF协会CTO表示，选择JPEG XL作为支持HDR内容的首选解决方案。该格式具备广色域、超高分辨率和多通道支持等优势，但目前仍缺乏广泛的浏览器支持。

图像处理

拖拽编辑

多模态扩散变换器

2025-09-28

港科大推出LazyDrag：一招搞定图片编辑难题，不用训练就能让照片"听话"

港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法，采用显式对应地图技术，实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能，能智能理解用户意图，在准确性和感知质量方面全面超越现有方法，为AI辅助图片编辑开辟了新方向。

人工智能

图像处理

模型优化

2025-09-08

Gemini"香蕉"AI图像编辑体验：有趣但问题不少

谷歌发布的Gemini 2.5 Flash Image AI图像编辑模型被用户昵称为"纳米香蕉"。该模型在添加图像元素和保持人物一致性方面表现出色，处理速度快且自动添加水印。但存在明显局限：只能生成方形图像、会降低照片分辨率、难以处理复杂编辑任务如移除反射等。谷歌表示正在改进相关问题。该功能免费提供，付费用户可获得更多使用额度。

智能监控

图像处理

全景技术

2025-09-05

安客智能体监控摄像头实现360度全方位实时监控

安克旗下智能家居品牌Eufy发布了最新款安防摄像头产品，该设备采用先进的全景监控技术，能够实现360度无死角覆盖，同时监控多个区域。这款摄像头配备了高清成像系统和智能识别功能，可为用户提供更全面的家庭或办公场所安全保护，标志着智能安防设备在监控范围和效率方面的重要技术突破。

人工智能

图像处理

模型优化

2025-08-27

Gemini 2.5 Flash Image发布，图像编辑精度大幅提升

谷歌升级Gemini聊天机器人，推出新的AI图像模型Gemini 2.5 Flash Image，让用户能更精确地控制照片编辑。该模型基于自然语言请求进行图像编辑，同时保持面部、动物等细节的一致性，解决了竞争对手工具的常见问题。新工具在LMArena等基准测试中表现出色，专为消费者使用场景设计，支持多轮对话和多参考融合功能，并配备安全防护措施防止不当内容生成。

图像处理

部分卷积

风格转换

2025-08-15

东卡罗莱纳大学让AI画笔只在你想要的地方作画——告别全图风格转换的尴尬时代

东卡罗莱纳大学研究团队开发了一种革命性的AI风格转换技术，能够精准地只对图片中用户选择的特定区域进行艺术化处理，而非传统的整张图片处理。该技术采用部分卷积方法，配合三种创新的边界融合技术，解决了区域风格转换中的色彩分布不匹配和边界不自然等关键问题，支持多区域多风格并行处理，几秒内完成转换，已开源供开发者使用。

人工智能

图像处理

性能优化

2025-08-13

英伟达为最小工作站GPU配备Blackwell架构

Nvidia在温哥华Siggraph大会上发布了两款小型Blackwell GPU：RTX Pro 4000 SFF和RTX Pro 2000，功耗仅70瓦。RTX 4000 SFF配备8960个CUDA核心，光线追踪性能提升1.7倍，AI性能提升2.5倍，搭载24GB GDDR7显存。RTX Pro 2000拥有4352个CUDA核心，3D建模性能提升1.6倍。两款产品将由戴尔、惠普、联想等厂商集成到OEM系统中。

人工智能

图像处理

技术优化

2025-08-12

Adobe推出AI新功能提升Photoshop图像融合效果

Adobe推出Photoshop新AI功能Harmonize，旨在解决图像合成中的光影匹配问题。该工具通过机器学习技术，一键调整图像的光照环境、色彩和阴影，让合成对象自然融入背景。经过多年研发，该功能已在测试版中发布，能将原本繁琐的修图过程缩短至几分钟。同时Adobe还将推出生成式放大工具和升级版移除功能，旨在提升而非替代人类编辑工作。

人工智能

图像处理

工具优化

2025-07-30

Photoshop推出强大AI工具助力内容创作者

Adobe发布Photoshop全新AI工具套件，包括Harmonize智能融合功能、生成式放大工具和改进的移除工具。Harmonize可自动调整色彩、光线和阴影，实现无缝合成；生成式放大可将图像提升至800万像素而不损失清晰度；改进的移除工具能精准清理图像并生成逼真填充内容。新功能还包括Projects项目管理和双Firefly模型选择器，支持桌面、网页和移动端使用。

人工智能

图像处理

算法优化

2025-07-17

清华大学团队重磅发布：一个AI模型既会画画又会"思考"图片，颠覆传统人工智能设计

清华、浙大等高校联合研发MergeVQ框架，首次实现单一AI模型同时精通图像理解与生成。通过创新的信息分层处理和Token合并技术，该系统用传统方法五分之一的计算资源达到更优性能，在ImageNet测试中展现突出效果。这一突破为AI视觉技术的高效化和普及化开辟新路径，有望推动智能相册、内容创作、电商推荐等多领域应用发展。

解剖自然图像的秘密：伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"

计算机视觉

深度学习

图像处理

2025-07-07

解剖自然图像的秘密：伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"

这篇研究来自加州大学伯克利分校和谷歌研究院团队，探讨了什么让图像看起来"自然"这一问题。论文提出了一种识别自然图像特征的深度学习方法，通过训练神经网络区分真实照片与人工处理的图像，并能将"不自然"的图像转化为更自然的版本。研究不仅揭示了自然图像在颜色分布、纹理特征和内容语义等方面的规律，还展示了在图像修复、质量提升和伪造检测等领域的潜在应用，为理解人类视觉感知和改进AI图像生成提供了新视角。

多模态AI的"审美偏见"：德州农工大学团队发现，有时候糊一点的图片反而让AI表现更好

人工智能

图像处理

算法优化

2025-06-27

多模态AI的"审美偏见"：德州农工大学团队发现，有时候糊一点的图片反而让AI表现更好

德州农工大学研究团队发现多模态AI存在"视觉质量悖论"，即AI在处理略显模糊或有噪点的图片时，在推理任务上反而表现更好。研究开发了VQ-TTT技术，能动态调整图片特征以匹配AI偏好，最高提升8.6%准确率且计算开销极小。这一发现挑战了"高画质对AI更好"的传统认知，为AI优化提供新思路。

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: