视频生成模型文章列表第1页-至顶网频道

视频生成模型关键字列表

人工智能

多模态生成

视频生成模型

2026-05-21

Gemini Omni正式发布：多模态输入生成高质量视频

谷歌推出全新模型Gemini Omni，支持图像、音频、视频和文本的多模态输入，并可生成高质量视频。用户可通过自然语言对话编辑视频，保持角色一致性与场景连贯性。Omni结合物理直觉与Gemini的知识库，实现更真实的视觉效果。首款产品Gemini Omni Flash已向全球Plus、Pro和Ultra订阅用户开放，并将逐步向开发者和企业客户提供API接入。

视频生成模型

Open-Sora Plan

可变分辨率

可变时长

2024-03-05

Open-Sora Plan项目：旨在重现 OpenAI 的视频生成模型Sora

北大和Rabbitpre AI发起的Open-Sora Plan项目致力于复现OpenAI的视频生成模型Sora。项目包括Video VQ-VAE压缩视频至潜在维度，Denoising Diffusion Transformer去噪，以及Condition Encoder支持多条件输入。特色在于支持可变长宽比、分辨率和时长，通过动态掩蔽策略、位置插值等技术实现高效训练和生成不同规格的视频。

白皮书

数字化转型方略

人工智能

多模态生成

视频生成模型

Gemini Omni正式发布：多模态输入生成高质量视频

视频生成模型

Open-Sora Plan

可变分辨率

可变时长

Open-Sora Plan项目：旨在重现 OpenAI 的视频生成模型Sora

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: