谷歌发布Veo 3.1 AI视频生成模型更新,显著改进了提示词遵循能力和图像转视频功能。新版本可同时生成视频和音频,并在Flow视频编辑器中新增"帧到视频"功能,用户可上传首尾帧自动生成中间内容。虽然在真实感方面仍不如OpenAI的Sora 2,但谷歌专注于为专业视频工作者提供实用工具的策略值得认可。
OpenAI推出的AI视频生成应用Sora在不到五天内下载量突破100万次,增长速度超过ChatGPT。该应用类似TikTok,提供无限垂直视频流,但所有视频均由AI生成。用户只需输入提示词即可创建10秒视频,还可通过Cameo功能制作个人视频。尽管目前仅在北美地区开放且需要邀请码使用,但已引发版权争议和娱乐行业反弹。
OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植入生成场景中,并可与朋友分享形象使用权限。该iOS应用目前在美加地区采用邀请制,ChatGPT Pro用户可直接体验。
据报道,OpenAI正准备发布一款由即将推出的Sora 2视频模型驱动的独立社交应用。该应用与TikTok高度相似,采用垂直视频信息流和滑动滚动导航。不过,该应用仅支持AI生成的内容,用户无法从手机相册上传照片或视频。Sora 2在应用内生成的视频时长限制为10秒或更短。应用还包含身份验证工具,允许用户使用自己的肖像生成视频,其他用户可以标记并在重新混合视频时使用他们的肖像。
Meta公司推出名为"Vibes"的全新信息流功能,专门展示由创作者使用AI技术制作的视频内容。该功能将人工智能生成的视频内容进行整合和分类,为用户提供更加个性化的AI视频浏览体验,标志着Meta在AI内容分发领域的又一重要布局。
Meta AI应用推出名为Vibes的新功能,专门展示AI生成的短视频内容。用户可以浏览他人创作的AI视频,也能从零开始制作或改编现有视频。创建的视频支持私信分享或转发至Instagram和Facebook。CEO扎克伯格表示这是新产品方向的早期探索,Meta超级智能实验室将与Midjourney等公司合作开展AI项目。
YouTube在年度Made on YouTube活动中发布多项更新,包括Studio新增"相似度"检测和唇同步配音功能,YouTube Live支持迷你游戏和双格式同步直播,Shorts集成Veo 3 AI视频生成模型。此外还推出播客AI剪辑工具、新的货币化选项如品牌合作和购物标签功能,以及YouTube Music的粉丝互动新特性。
人工智能初创公司Luma AI发布Ray3文本转视频AI模型,专为专业影像制作设计。该模型具备思维链推理能力,能够理解场景描述并遵循创意专业人士的指令。Ray3可评估自身输出并优化结果,支持复杂场景规划。模型能生成真正的高动态范围视频,支持专业ACES2065-1 EXR标准。用户可从文本和图像生成长达10秒的视频片段。Luma AI与Adobe合作将Ray3集成到Firefly应用中,并获得电通数码等企业采用。
Luma AI发布首个AI推理视频模型Ray3,该模型能够在生成视频前进行"思考"。与传统AI视频生成器不同,Ray3采用推理技术,能够花费更多计算时间处理请求并检查结果,从而创建更复杂的动作序列视频。新功能包括16位HDR生成、可视化注释工具和草稿模式,用户可在20秒内快速测试创意,然后升级至高清分辨率。
YouTube在其直播活动中发布了多项面向Shorts创作者的生成式AI工具,包括定制版Veo 3 Fast视频生成模型、新的混音工具和AI编辑功能。Veo 3 Fast能以480p分辨率低延迟生成带声音的视频片段,支持图像动画化、视频风格转换等功能。新的语音转歌曲混音工具可将对话转为配乐,AI编辑功能则能将原始素材自动制作成初稿。这些工具将陆续在多个市场推出。
Google Photos现已集成Veo 3人工智能技术,用户可以免费将相册中的静态照片转换为动画效果。这项新功能利用先进的AI算法,能够自动识别照片内容并生成流畅的动画效果,为用户的回忆增添生动的视觉体验。该功能完全免费提供,用户只需在Google Photos应用中选择相应照片即可一键生成动画。
## 腾讯发布HunyuanWorld-Voyager开源AI模型,可将单张图片生成3D一致性视频序列,用户可控制相机路径"探索"虚拟场景。该模型同时生成RGB视频和深度信息,支持直接3D重建。模型采用Transformer架构,使用超10万视频片段训练,在WorldScore基准测试中获得77.62最高分。但需要60GB以上GPU内存运行,且在欧盟等地区使用受限。
AI公司Midjourney发布首个视频模型,用户可将图像制作成动画,支持平台内生成或外部上传的图片。初始视频为5秒片段,可延长至最多20秒。该功能仅限网页端使用,需月付10美元订阅。尽管在视频AI领域起步较晚,但面临创作者指控其模型训练涉嫌侵权。迪士尼和NBC环球上周起诉该公司版权侵权。
知名AI图像生成公司Midjourney发布备受期待的AI视频生成模型V1。该模型可将用户上传的图像转换为四段5秒视频,仅通过Discord提供服务。V1与OpenAI的Sora、Runway的Gen 4等产品竞争,但更专注创意应用而非商业用途。公司计划未来开发3D渲染和实时AI模型,最终目标是创建实时开放世界模拟系统。视频生成费用为图像生成的8倍,最低订阅计划为每月10美元。
Google 将 Veo 2 AI 视频生成模型引入其 Gemini Advanced 订阅服务,用户可生成 8 秒、720p 分辨率的视频并方便分享;未来还计划结合 DeepMind 的 AI 模型优化对真实世界的理解。
AI视频生成公司Runway宣布完成3.08亿美元融资,由General Atlantic领投,估值超30亿美元。公司刚发布新一代视频生成模型Gen-4,可生成长达10秒的视频片段。Runway计划利用新资金加强AI开发,重点提升训练数据集质量和扩展扩散模型与大语言模型能力。
Runway AI公司推出了迄今为止最先进的AI视频生成模型Gen-4,实现了多镜头间角色和场景的一致性,这是之前大多数AI视频生成器无法做到的。该模型可生成720p分辨率的5-10秒视频片段,并计划本周推出更多功能。这一突破可能彻底改变电影制作流程,引发了对版权和就业的讨论,也为创作者带来了新的机遇和挑战。
AI 视频创业公司 Runway 发布了最新的 Gen-4 视频合成模型,声称解决了 AI 视频生成的几个关键问题。该模型能够在不同场景中保持人物和物体的一致性,并允许从多个角度拍摄同一环境或主题。这一突破性进展有望为创意专业人士提供更实用的 AI 视频制作工具。
Moonvalley 公司推出 Marey,这是一款专为好莱坞影视制作和品牌营销设计的 AI 视频生成模型。与其他使用网络抓取数据的模型不同,Marey 仅使用完全授权的数据进行训练,为影视行业提供了一个无版权争议的 AI 视频创作选择。该模型具备高清视频生成、长视频制作、分层编辑等多项先进功能,旨在辅助而非取代专业创作者。