图像处理 关键字列表
Facebook推出AI功能:可为头像和动态添加动画效果

Facebook推出AI功能:可为头像和动态添加动画效果

Facebook正在推出新的AI功能,让用户可以将静态头像制作成动画效果,并为Stories和Memories提供重新设计选项。用户可以通过预设动画让照片做出挥手、戴派对帽等动作。该功能建议使用面向镜头的单人照片效果最佳。此外,用户还可以为文字帖子添加动画背景,让内容在信息流中更加醒目。这是Meta让Facebook重新获得文化相关性努力的一部分。

Facebook推出AI动画头像和文字帖背景功能

Facebook推出AI动画头像和文字帖背景功能

Facebook发布多项AI驱动的新功能,包括动画头像、照片重新设计工具和文本帖子动画背景。动画头像功能可为静态照片添加挥手、比心等动作效果。Stories和Memories新增"Restyle"工具,用户可通过文本提示或预设主题重新设计上传图片的外观风格。此外,用户还可为文本帖子添加落叶、海浪等动画背景。这些更新旨在为年轻用户提供更个性化的体验。

Google Photos 支持文本提示生成视频功能

Google Photos 支持文本提示生成视频功能

谷歌相册推出文字提示功能,用户可通过描述性文本指导图片转视频的生成效果,包括动作、风格和特效等。该功能补充了原有的"细微动作"和"随机生成"选项,提供更精准的创作控制。新功能仅限18岁以上用户使用,同时支持默认添加音频,生成可直接发布的视频内容。

Photoshop AI工具全面升级:更高分辨率输出,更精准控制

Photoshop AI工具全面升级:更高分辨率输出,更精准控制

Adobe为Photoshop新增三个无损可遮罩调整图层:清晰度、去雾和颗粒效果,帮助创作者精确调整纹理、深度和细节。生成填充参考图像功能升级,可更准确保持物体身份特征。基于改进的Firefly模型,生成填充、扩展和移除工具现支持2K分辨率输出,细节更清晰,瑕疵更少。新增动态文本测试版,可轻松将文本转换为圆形、弧形等形状。

利用生成式AI为老照片上色和修复

利用生成式AI为老照片上色和修复

珍贵的老照片和家庭纪念品往往因岁月侵蚀而褪色损坏,传统的照片修复和上色技术既耗时又需要专业技能。现在,借助生成式AI技术,普通用户也能轻松让老照片重焕生机。文章介绍了使用Adobe Firefly等AI工具的完整流程:首先将照片数字化,然后选择合适的AI系统,逐步进行上色和修复。过程中需要提供详细指令、进行多次优化,并分阶段处理严重损坏的照片,以获得最佳效果。

苹果宣布专业图像编辑应用Pixelmator Pro即将登陆iPad

苹果宣布专业图像编辑应用Pixelmator Pro即将登陆iPad

苹果宣布Pixelmator Pro将于1月28日在iPad平台推出,为用户带来桌面级设计体验。新版本集成了完整的图层侧边栏、智能选择工具、高级位图和矢量蒙版等专业功能。借助苹果芯片深度整合,应用支持超分辨率照片放大、去条带压缩等AI功能。完全支持Apple Pencil,提供压感笔刷和像素级精准设计。需要A16、A17 Pro或M1及更新芯片的设备运行。

特伦托大学最新突破:AI换脸技术的"反向操作"让身份匿名化成为可能

特伦托大学最新突破:AI换脸技术的"反向操作"让身份匿名化成为可能

意大利特伦托大学联合芬兰奥卢大学开发的"反向个性化"技术,通过巧妙的AI逆向操作实现了高质量的人脸匿名化。该技术使用负向引导机制,让AI在保留表情、姿势等关键信息的同时有效去除身份特征,并支持用户精确控制需要保留或修改的面部属性。相比传统方法,该技术无需专门训练即可处理任意人物照片,在身份去除效果、属性保留质量和图像质量方面都实现了显著提升,为医疗、教育、社交媒体等领域的隐私保护提供了新的解决方案。

Splat应用利用AI将照片转换为儿童涂色页面

Splat应用利用AI将照片转换为儿童涂色页面

Retro团队开发的Splat应用通过生成式AI技术,将用户拍摄的照片或从相册选择的图片转换为儿童涂色页。用户可选择动漫、3D电影、漫画等风格,AI会快速生成可打印或屏幕涂色的页面。应用提供动物、太空、花卉等教育分类,采用订阅制收费模式,每周4.99美元或年费49.99美元。

PDF协会选择JPEG XL作为首选图像格式

PDF协会选择JPEG XL作为首选图像格式

PDF协会在欧洲会议上宣布,将在PDF规范中添加对JPEG XL图像格式的支持。尽管Chromium团队此前将该格式标记为过时,但此次纳入可能为JXL带来主流应用机会。PDF协会CTO表示,选择JPEG XL作为支持HDR内容的首选解决方案。该格式具备广色域、超高分辨率和多通道支持等优势,但目前仍缺乏广泛的浏览器支持。

港科大推出LazyDrag:一招搞定图片编辑难题,不用训练就能让照片"听话"

港科大推出LazyDrag:一招搞定图片编辑难题,不用训练就能让照片"听话"

港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法,采用显式对应地图技术,实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能,能智能理解用户意图,在准确性和感知质量方面全面超越现有方法,为AI辅助图片编辑开辟了新方向。

Gemini"香蕉"AI图像编辑体验:有趣但问题不少

Gemini"香蕉"AI图像编辑体验:有趣但问题不少

谷歌发布的Gemini 2.5 Flash Image AI图像编辑模型被用户昵称为"纳米香蕉"。该模型在添加图像元素和保持人物一致性方面表现出色,处理速度快且自动添加水印。但存在明显局限:只能生成方形图像、会降低照片分辨率、难以处理复杂编辑任务如移除反射等。谷歌表示正在改进相关问题。该功能免费提供,付费用户可获得更多使用额度。

安客智能体监控摄像头实现360度全方位实时监控

安客智能体监控摄像头实现360度全方位实时监控

安克旗下智能家居品牌Eufy发布了最新款安防摄像头产品,该设备采用先进的全景监控技术,能够实现360度无死角覆盖,同时监控多个区域。这款摄像头配备了高清成像系统和智能识别功能,可为用户提供更全面的家庭或办公场所安全保护,标志着智能安防设备在监控范围和效率方面的重要技术突破。

Gemini 2.5 Flash Image发布,图像编辑精度大幅提升

Gemini 2.5 Flash Image发布,图像编辑精度大幅提升

谷歌升级Gemini聊天机器人,推出新的AI图像模型Gemini 2.5 Flash Image,让用户能更精确地控制照片编辑。该模型基于自然语言请求进行图像编辑,同时保持面部、动物等细节的一致性,解决了竞争对手工具的常见问题。新工具在LMArena等基准测试中表现出色,专为消费者使用场景设计,支持多轮对话和多参考融合功能,并配备安全防护措施防止不当内容生成。

东卡罗莱纳大学让AI画笔只在你想要的地方作画——告别全图风格转换的尴尬时代

东卡罗莱纳大学让AI画笔只在你想要的地方作画——告别全图风格转换的尴尬时代

东卡罗莱纳大学研究团队开发了一种革命性的AI风格转换技术,能够精准地只对图片中用户选择的特定区域进行艺术化处理,而非传统的整张图片处理。该技术采用部分卷积方法,配合三种创新的边界融合技术,解决了区域风格转换中的色彩分布不匹配和边界不自然等关键问题,支持多区域多风格并行处理,几秒内完成转换,已开源供开发者使用。

英伟达为最小工作站GPU配备Blackwell架构

英伟达为最小工作站GPU配备Blackwell架构

Nvidia在温哥华Siggraph大会上发布了两款小型Blackwell GPU:RTX Pro 4000 SFF和RTX Pro 2000,功耗仅70瓦。RTX 4000 SFF配备8960个CUDA核心,光线追踪性能提升1.7倍,AI性能提升2.5倍,搭载24GB GDDR7显存。RTX Pro 2000拥有4352个CUDA核心,3D建模性能提升1.6倍。两款产品将由戴尔、惠普、联想等厂商集成到OEM系统中。

Adobe推出AI新功能提升Photoshop图像融合效果

Adobe推出AI新功能提升Photoshop图像融合效果

Adobe推出Photoshop新AI功能Harmonize,旨在解决图像合成中的光影匹配问题。该工具通过机器学习技术,一键调整图像的光照环境、色彩和阴影,让合成对象自然融入背景。经过多年研发,该功能已在测试版中发布,能将原本繁琐的修图过程缩短至几分钟。同时Adobe还将推出生成式放大工具和升级版移除功能,旨在提升而非替代人类编辑工作。

Photoshop推出强大AI工具助力内容创作者

Photoshop推出强大AI工具助力内容创作者

Adobe发布Photoshop全新AI工具套件,包括Harmonize智能融合功能、生成式放大工具和改进的移除工具。Harmonize可自动调整色彩、光线和阴影,实现无缝合成;生成式放大可将图像提升至800万像素而不损失清晰度;改进的移除工具能精准清理图像并生成逼真填充内容。新功能还包括Projects项目管理和双Firefly模型选择器,支持桌面、网页和移动端使用。

清华大学团队重磅发布:一个AI模型既会画画又会"思考"图片,颠覆传统人工智能设计

清华大学团队重磅发布:一个AI模型既会画画又会"思考"图片,颠覆传统人工智能设计

清华、浙大等高校联合研发MergeVQ框架,首次实现单一AI模型同时精通图像理解与生成。通过创新的信息分层处理和Token合并技术,该系统用传统方法五分之一的计算资源达到更优性能,在ImageNet测试中展现突出效果。这一突破为AI视觉技术的高效化和普及化开辟新路径,有望推动智能相册、内容创作、电商推荐等多领域应用发展。

解剖自然图像的秘密:伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"

解剖自然图像的秘密:伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"

这篇研究来自加州大学伯克利分校和谷歌研究院团队,探讨了什么让图像看起来"自然"这一问题。论文提出了一种识别自然图像特征的深度学习方法,通过训练神经网络区分真实照片与人工处理的图像,并能将"不自然"的图像转化为更自然的版本。研究不仅揭示了自然图像在颜色分布、纹理特征和内容语义等方面的规律,还展示了在图像修复、质量提升和伪造检测等领域的潜在应用,为理解人类视觉感知和改进AI图像生成提供了新视角。

多模态AI的"审美偏见":德州农工大学团队发现,有时候糊一点的图片反而让AI表现更好

多模态AI的"审美偏见":德州农工大学团队发现,有时候糊一点的图片反而让AI表现更好

德州农工大学研究团队发现多模态AI存在"视觉质量悖论",即AI在处理略显模糊或有噪点的图片时,在推理任务上反而表现更好。研究开发了VQ-TTT技术,能动态调整图片特征以匹配AI偏好,最高提升8.6%准确率且计算开销极小。这一发现挑战了"高画质对AI更好"的传统认知,为AI优化提供新思路。