谷歌NotebookLM现可将用户研究笔记转换为完全动画化的"电影级"视频。该升级功能使用Gemini 3等AI模型组合,根据笔记内容生成动画视觉效果,超越了此前仅能制作旁白幻灯片的限制。该功能目前仅对18岁以上Google AI Ultra订阅用户开放,支持英文,每日最多生成20个视频。
谷歌继续改进NotebookLM的视频概览功能,推出全新的电影级视频概览。该功能结合Gemini 3、Nano Banana Pro和Veo 3三大AI模型,创建更加生动丰富的动画视频。Gemini 3担任创意总监角色,负责风格、叙述和结构决策。新功能告别了简单的旁白幻灯片时代,为用户提供更具视觉冲击力的内容。目前该功能仅向AI Ultra订阅用户开放。
字节跳动发布新一代AI视频生成模型Seedance 2.0,支持文本、图像、视频和音频多模态输入。该模型可生成最长15秒的带音频视频片段,能处理复杂多主体场景,支持摄像机运动、视觉效果和动作控制。用户可通过最多9张图片、3个视频片段和3个音频片段来优化文本提示。目前仅在字节跳动的Dreamina AI平台和豆包AI助手上提供服务。
Runway平台推出Motion Sketch功能,用户只需在静态图像上绘制简单涂鸦即可生成视频片段。该工具通过识别手绘箭头和形状来理解运动方向,无需复杂文本提示。测试显示,该功能能够将基础涂鸦转化为动态视频,尽管仍存在一些技术缺陷,但为创意行业专业人士提供了全新的视觉化创作方式,大大降低了从想象到制作的门槛。
今年超级碗期间,多个品牌使用AI生成技术制作广告,但效果普遍不佳。Artlist仅用5天制作的AI广告充满廉价感,Svedka伏特加的AI机器人广告出现明显技术故障,这些都未能展现AI技术的实用价值。虽然AI制作成本更低、速度更快,但与传统制作相比质量明显下降。连一些使用传统特效的广告也因视觉效果不佳被误认为是AI制作。这波AI广告潮不仅没有成功推广技术,反而引发了公众对AI生成内容质量的广泛质疑。
Runway推出名为Motion Sketch的新AI视频生成功能,用户可在静态图像上绘制简单涂鸦来生成视频。该工具能识别手绘的运动方向指示和形状,将其转换为动态视频片段。虽然仍需要一些调试和文本提示辅助,但为视觉创作者提供了全新的视频制作方式,降低了从想象到制作的门槛。该功能需要Runway标准订阅服务。
继去年在超级碗广告中展示AI技术后,2026年的广告更进一步,不仅用AI制作广告,还推广最新AI产品。Svedka推出首个主要由AI生成的超级碗广告,Anthropic的Claude广告暗讽OpenAI,Meta展示AI眼镜,亚马逊推出Alexa+,Ring的AI宠物搜索功能等。这些品牌通过AI技术在超级碗这一顶级广告舞台上展现创新,引发关于AI是否会取代创意工作的争论。
OpenAI的AI视频生成应用Sora在十月份强势登顶应用商店榜首后,如今正面临严峻挑战。最新数据显示,随着用户对这款AI视频社交网络的初期热情消退,该应用的下载量和用户消费均出现显著下降。12月份下载量环比下降32%,1月份进一步下滑45%。尽管累计下载量达960万次,但美国应用商店排名已跌至101位。版权争议、竞争加剧以及用户兴趣减弱成为主要影响因素。
总部位于伦敦的AI视频虚拟形象平台Synthesia宣布完成2亿美元E轮融资,公司估值达到40亿美元。该公司利用生成式AI技术创建逼真的视频虚拟形象,用户可通过网络摄像头创建个人虚拟形象并配音,支持30多种语言交流。平台还提供230多个预建虚拟形象,支持140多种语言。本轮融资由谷歌风投领投,资金将用于重新定义员工学习方式,专注开发基于对话式AI代理的教育和技能提升产品。
AI内容生成技术已融入Adobe和Canva等日常工具,创作者越来越多地在本地PC上运行这些工作流程以保持资产控制权并降低云服务成本。NVIDIA RTX PC凭借高性能优势成为创意AI的首选系统。本文介绍如何使用ComfyUI和流行模型在RTX PC上开始可视化生成式AI创作,包括FLUX.2图像生成和LTX-2视频生成的详细操作步骤和优化技巧。
谷歌扩大了AI视频制作工具Flow的使用范围。该工具于去年5月推出,最初仅向Google AI Pro和AI Ultra订阅用户开放,现在Business、Enterprise和Education Workspace计划用户也可使用。Flow基于谷歌Veo 3.1 AI视频生成模型,可根据文本提示或图像生成8秒视频片段,用户可拼接片段创建更长场景,还能调整光照、镜头角度和编辑场景对象。
谷歌升级Veo 3.1 AI视频模型,增强"素材转视频"工具的视觉效果。新版本能更好地基于参考图片生成视频,包括竖屏方向的图片。工具支持使用最多三张参考图片生成视频,提取角色、背景和纹理等元素。更新后视频将更具表现力和创意,角色在不同场景中保持一致性。新增原生9:16竖屏输出支持,适配TikTok和YouTube Shorts等平台。此外,用户现可将生成视频升级至4K分辨率,1080p视频质量也得到改善。
Lightricks与英伟达合作推出Lightricks-2 AI视频模型,可在本地设备运行而非依赖云服务。该模型支持生成20秒长、50帧每秒的4K视频片段,并包含原生音频。作为开放权重模型,它为专业创作者提供更安全的选择,保护知识产权。借助英伟达RTX芯片优化,用户可获得高质量结果同时控制数据隐私,缩短生成时间至1-2分钟。
2025年AI技术主导了娱乐产业讨论,但尚未出现展现AI潜力的优秀影视作品。好莱坞从最初的版权诉讼转向与AI公司合作,迪士尼与OpenAI签署十亿美元协议,Netflix和亚马逊也推出AI项目。然而这些合作产生的内容质量堪忧,如亚马逊的AI配音和剧集总结功能因错误频出被撤下。尽管投入巨大,生成式AI项目仍未证明其价值。
迪士尼与OpenAI达成三年授权协议,允许Sora视频生成器创建包含超过200个迪士尼、漫威、皮克斯和星战角色的用户定制社交视频。该协议包括迪士尼对OpenAI的10亿美元投资,以及在Disney Plus平台展示Sora生成内容的计划。合作涵盖米老鼠、钢铁侠、黑豹、达斯·维达等知名角色,预计2026年初开始提供服务。
迪士尼与OpenAI达成三年合作协议,授权200多个迪士尼、皮克斯、漫威和星球大战角色用于Sora视频和ChatGPT图像生成。迪士尼将向OpenAI投资10亿美元股权,成为其主要客户。协议明确不包含真人演员肖像和声音授权,仅限动画版本角色。同时迪士尼向谷歌发出停止侵权通知,要求停止基于其IP生成内容。这标志着娱乐巨头积极拥抱AI技术变革。
AI视频生成公司Runway推出首个世界模型GWM-1,通过逐帧预测创建具备物理理解能力的仿真环境。该公司还发布了三个专门版本:GWM-Worlds用于交互式场景创建,GWM-Robotics利用合成数据训练机器人,GWM-Avatars模拟真实人类行为。同时,Runway更新了Gen 4.5模型,新增原生音频和长视频生成功能,支持一分钟视频制作及多镜头叙事。
Runway发布代号"Whisper Thunder"的4.5版本AI视频生成模型,展现出强大的视频生成能力。该模型能够创建高质量的人物和动物奔跑、形态变换等复杂场景视频,在文本转视频排行榜上表现卓越。新模型支持多种风格控制,包括写实、动画和电影风格,具备快速生成、无水印等特点。Runway作为AI视频领域的黑马公司,获得了英伟达等知名投资方支持,其CEO表示希望防止AI技术被少数公司垄断。
AI初创公司Runway和深度求索今日发布两款新基础模型,声称性能超越科技巨头算法。Runway的Gen-4.5提供文本转视频功能,在人工智能分析文本转视频基准测试中创下新纪录,能更好地遵循提示并生成更逼真的视频内容。深度求索发布的V3.2版本在编程和数学任务方面表现更优,采用新的注意力机制实现DSA,降低硬件使用率。两款模型均针对不同应用场景进行了优化。
OpenAI因服务器需求激增对Sora视频生成服务实施限制,免费用户每日仅可生成6个视频。Sora负责人称"GPU正在融化",希望让更多用户能够使用服务。谷歌也对其AI模型实施类似限制,免费用户图像生成数量减少至每日2张。报告显示,OpenAI数据中心合作伙伴为支持AI服务需求已累积近千亿美元债务,凸显了大规模提供生成式AI服务的巨大成本压力。