人工智能文章列表第33页-至顶网频道

2025-06-09

记忆坚实的世界：斯坦福和上海交大研究团队为视频世界模型打造长期空间记忆

斯坦福大学和上海交大等机构的研究团队提出了一种为视频世界模型增加长期记忆能力的创新方法。受人类记忆机制启发，他们设计了三种互补的记忆系统：短期工作记忆、基于点云的长期空间记忆和稀疏情节记忆。这种组合允许AI在生成长视频时保持场景的空间一致性，解决了现有模型因有限上下文窗口导致的"遗忘"问题。实验表明，该方法在视角回忆一致性和整体视频质量方面显著优于现有技术，为创建持续一致的虚拟世界铺平了道路。

对角线批处理技术：突破循环记忆Transformer模型在长上下文处理中的并行瓶颈

这篇研究介绍了"对角线批处理"技术，该技术解决了循环记忆Transformer模型在处理长文本时的并行计算瓶颈。通过重新编排计算顺序，研究团队实现了在不破坏依赖关系的情况下进行并行计算，使LLaMA-1B模型处理长文本的速度提升3.3倍，同时内存使用减少167.1倍。这种纯运行时优化不需要重新训练模型，为实际应用中的长文本处理提供了高效解决方案。

PATS技术：博尔扎诺自由大学研究团队开创的运动技能评估新方法，让AI更懂专业运动员的动作质量

博尔扎诺自由大学研究团队开发的PATS技术通过保留完整运动片段代替随机抽取视频帧，显著提升了AI评估体育技能的能力。该方法在EgoExo4D基准测试中表现出色，攀岩评估准确率提高26.22%，音乐提高2.39%，篮球提高1.13%。PATS能根据不同运动类型自动调整采样策略，为体育训练和人才发展提供了更准确的自动评估技术。

ComfyUI-Copilot：阿里巴巴推出的智能助手让AI艺术创作更简单

阿里巴巴与哈工大(深圳)联合推出的ComfyUI-Copilot是一款基于大语言模型的插件，旨在提升AI艺术创作平台ComfyUI的易用性。它采用多代理框架提供三大核心功能：智能节点和模型推荐、一键式工作流构建和专业问答服务，所有功能由涵盖7K节点、62K模型和9K工作流的知识库支持。评估显示其推荐准确率高，已吸引超过1.6K的GitHub星标和来自22个国家19K用户的使用。

物理感知视频生成新突破：上海交大团队开发VideoREPA，通过关系对齐赋予AI视频物理常识

上海交大研究团队开发的VideoREPA是一种突破性的视频生成框架，通过令牌关系蒸馏技术将视频理解模型中的物理知识转移到文本到视频（T2V）扩散模型中。与传统方法不同，VideoREPA关注空间和时间关系的对齐，使生成的视频更符合物理常识。实验表明，这种方法在VideoPhy基准测试中将物理常识分数提高了24.1%，明显优于现有技术。该研究为创建更真实的AI生成视频提供了新思路，展示了理解能力与生成质量间的密切关联。

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: