最新文章
DiMeR:让普通图像转3D更简单,香港科技大学发布全新"解构式"网格重建模型
2025-04-27

DiMeR:让普通图像转3D更简单,香港科技大学发布全新"解构式"网格重建模型

DiMeR是由香港科技大学研究团队开发的创新3D网格重建模型,通过解构式设计将形状和纹理分离处理。模型使用法线图专门重建几何形状,再用RGB图像生成纹理,成功解决了传统方法中的训练歧义问题。实验表明,它在重建精度上比现有方法提升超过30%,并在多视图重建、单图像转3D和文本到3D生成等多任务中表现出色。这一突破性工作大幅降低了3D内容创作的门槛,为游戏开发、虚拟现实和电影制作等领域提供了强大工具。

2025-04-27

夸克AI超级框上新“拍照问夸克” 加码多模态能力

夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。

Step1X-Edit:突破性图像编辑框架,让AI轻松实现你的创意
2025-04-27

Step1X-Edit:突破性图像编辑框架,让AI轻松实现你的创意

想象一下,你有一张自己特别喜欢的照片,但照片中有些地方不太完美——也许背景有些单调,或者你希望将照片中的猫咪变成一只狗,又或者你想改变照片的整体风格。过去,这些编辑工作需要你具备专业的Photoshop技能,或者花费大量时间手动修改。

Google研究团队突破性成果:REFVNLI让文本生成图像评估更精准
2025-04-27

Google研究团队突破性成果:REFVNLI让文本生成图像评估更精准

一、为什么我们需要更好的图像生成评估方法? 想象一下《小王子》中的一个场景:叙述者试图安慰悲伤的王子,说道:"我会为你的花画一个围栏。"这个简单的描述实际上隐藏着一个复杂的挑战。要画出一幅合适的图,不仅需要准确地遵循文字描述(画一朵花周围的围栏),还需要确保画中的花就是王子心爱的那朵特定的花——拥有独特外观和历史的花。

打破模态屏障:使用多模态大语言模型实现通用嵌入学习
2025-04-27

打破模态屏障:使用多模态大语言模型实现通用嵌入学习

想象一下,你正在使用一个智能助手,希望它能根据你的文字描述找到相似的图片,或者通过一张图片找到相关的文本信息。这就像是你在和一个不懂你语言的人沟通,你们之间存在着一道"模态屏障"。为了让计算机理解并连接不同类型的信息(如图像和文本),研究人员需要开发能够将这些不同类型数据转化为通用"语言"的方法。

透过不同视角看世界:KAIST研究团队如何让AI理解多视角空间推理
2025-04-27

透过不同视角看世界:KAIST研究团队如何让AI理解多视角空间推理

想象一下,当你和朋友在公园里散步时,你指着远处说:"从那个长椅的角度看,那只狗在喷泉的左边还是右边?"这个看似简单的问题对人类来说轻而易举,因为我们自然而然地能够想象自己站在长椅的位置,并从那个视角"看"世界。但对于人工智能来说,这种换位思考的能力却是一项极具挑战的任务。

PaperCoder:机器学习论文代码自动生成的突破性框架
2025-04-27

PaperCoder:机器学习论文代码自动生成的突破性框架

想象一下,你是一名机器学习研究者,发现了一篇非常有趣的论文,但作者没有提供源代码。如果你想验证论文结果或在此基础上进行改进,你必须从头开始实现整个方法。这就像看到一道美食的菜谱,但没有详细的烹饪步骤,你只能靠自己的理解去尝试复现。

QuaDMix:为高效大语言模型预训练而生的质量-多样性平衡数据选择方法
2025-04-27

QuaDMix:为高效大语言模型预训练而生的质量-多样性平衡数据选择方法

想象一下你在制作一道美食。你需要什么?当然是优质的食材,但同时也需要各种不同类型的食材来确保菜肴丰富多样。大语言模型的训练也面临着类似的挑战。

Cohesity 推出 RecoveryAgent 简化事故响应

Cohesity 推出 RecoveryAgent 简化事故响应

RecoveryAgent 是 Cohesity 与 Veritas 合作推出的首款 AI 驱动恢复编排软件,通过自动化恢复蓝图和智能推荐恢复点,帮助用户高效应对网络安全事件,提升数据恢复能力。

Fedora 42找到了答案,但 Ubuntu 的 Plucky Puffin 也不甘落后

Fedora 42找到了答案,但 Ubuntu 的 Plucky Puffin 也不甘落后

Fedora 42 于4月15日发布,Ubuntu 25.04 随后登场;两者均基于 kernel 6.14 和 GNOME 48,各具优势,安装器、驱动支持等均有显著改进。

开发者们发出警报: Microsoft 从 VS Code 分支中移除了 C/C++ 扩展

开发者们发出警报: Microsoft 从 VS Code 分支中移除了 C/C++ 扩展

微软的 Visual Studio Code 的 C/C++ 扩展不再支持 VS Codium、Cursor 等派生产品,这破坏了开发者工作流程并引发不公平竞争的疑虑。

VMware 补丁凸显支持问题

VMware 补丁凸显支持问题

本文探讨了 VMware 推出安全补丁后,用户为应对关键零日漏洞和系统风险,不得不转向按核计费的订阅模式,以及这种模式下升级和支持优化带来的整体优势。

M&S 系统在网络安全事件发生数日后仍处于离线状态

M&S 系统在网络安全事件发生数日后仍处于离线状态

英国零售商 M&S 因网络安全事件暂停部分线上支付及自提服务,调整运营保障客户安全,并提醒用户警惕诈骗风险。

23.99万起,搭载华为乾崑,深蓝S09上海车展预售开启

23.99万起,搭载华为乾崑,深蓝S09上海车展预售开启

深蓝S09未来将搭载华为乾崑智驾辅助ADS 4,让车子更“好开”、“更好停”的同时更“安全”。

Zencoder 收购 Machinet 挑战 GitHub Copilot 随着 AI 编程助手整合加速

Zencoder 收购 Machinet 挑战 GitHub Copilot 随着 AI 编程助手整合加速

Zencoder 今日收购了在 JetBrains 平台备受欢迎的 Machinet,通过整合其“Repo Grokking”技术与多代理系统,为 Java 开发及其他 IDE 用户提供更高效的 AI 编码助手,力图超越 GitHub Copilot 等竞争对手。

Omdia:全光子网络构建更安全、更智能、更可持续的世界

Omdia:全光子网络构建更安全、更智能、更可持续的世界

文章探讨了由 AI 驱动的全光子网络发展趋势,强调其在未来数据中心高速、大容量和低能耗通信中的关键作用。

如何观看 LlamaCon 2025:Meta 首个生成式 AI 开发者大会

如何观看 LlamaCon 2025:Meta 首个生成式 AI 开发者大会

Meta将于4月29日举办全虚拟LlamaCon开发者大会,通过Meta for Developers Facebook页面直播,主旨演讲及多场高层对话将展示开源Llama模型系列及最新AI功能。

Microsoft 推出 Recall 及基于 AI 的 Windows 搜索功能,面向 Copilot Plus PC

Microsoft 推出 Recall 及基于 AI 的 Windows 搜索功能,面向 Copilot Plus PC

微软正式向 Copilot Plus PC 推出 Recall 功能,该功能自动截屏记录操作,并搭载基于 AI 的 Windows 搜索与 Click to Do,实现自然语言检索及便捷操作。

数据分析加速如何解决 AI 隐藏的瓶颈

数据分析加速如何解决 AI 隐藏的瓶颈

文章指出企业 AI 在海量数据预处理上受制于传统 CPU 架构,而专用数据分析加速器有望大幅提升性能和降低成本,从而提升实际投资回报。

在六年内,建设领先的 AI 数据中心可能花费2000亿美元

在六年内,建设领先的 AI 数据中心可能花费2000亿美元

研究显示,到2030年顶级 AI 数据中心或耗资 2000 亿美元、配备数百万芯片并需大量电力,能源与环境压力不断加剧。