文章介绍了即梦AI的智能画布工具,它能够帮助用户在国庆出游时,通过AI消除和AI扩图功能,轻松修复照片中的路人和不完美的构图。即梦AI提供简单易用的网页版操作,而美图秀秀则提供了移动端的相似功能。作者推荐这些工具,希望能为读者的国庆旅游照片处理提供便利。
字节正式发布了他们全新的两款AI视频模型:豆包视频生成-PixelDance模型和Seaweed模型。
毕竟好莱坞都抵制AI这么久了,又是罢工又是抗议的,你大厂怎么直接下场表示支持AI了?不过那句话怎么说来着,孤掌难鸣,毕竟这一个单独的Case,还没有办法让那么多的反对者倒戈。但是今天,作为好莱坞电影人的精神图腾,詹姆斯·卡梅隆居然也跟AI走到了一起,甚至还不是发言表达,而是直接身体力行亲身参与这股革命浪潮中。
OpenAI发布了新的AI模型OpenAI o1,它在复杂推理任务上取得显著进展,重置了命名序列。o1模型通过Self-play RL学习,具备了慢思考的特质,能够进行深度思考和推理。在AIME 2024数学竞赛和科学问题GPQA Diamond上,o1的表现超过了人类专家。o1模型已向ChatGPT Plus和Team用户开放,提供o1预览版和o1 mini两种版本,API价格不等。
一起用身边的熟人作乐,甚至是威胁,还以AI视频+公开受害女性身份、家庭住址为理由,向受害人索要钱财。 这一次,最大的受害者群体,是学生。
本周AI大事件包括Google发布Gemini 1.5 Pro和Gemma 2 2B模型,FLUX开源图像模型,Meta发布SAM 2图像分割模型。Gemini 1.5 Pro在LLM竞技场排名第一,支持音频和视频,Gemma 2 2B可在设备端运行。FLUX系列模型包括FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell],
最近X(也就是以前的推特)和马斯克,就被这玩意,推上了风口浪尖。原因是,X被发现“光明正大”的拿用户的帖子来训练Grok AI。就是马斯克自己搞的那个大模型。
Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口,并改进了对8种语言的支持。
钉钉这个AI搜索,跟外面那些抓全网的AI搜索很不一样,不做全网搜索,主打搜索用户在钉钉里面所有的聊天记录、文档、会议、日程、知识库等等。
Meme梗图,代表网络文化中的模仿和传播现象,通常用于表达特定情绪或态度。近期,AI产品Glif推出了一个meme梗图生成器,由创始人fabian开发,能够根据用户输入的主题实时生成含有幽默和讽刺的梗图。这得益于最新的大语言模型Claude3.5,其创意和玩梗能力超越了许多人类,引发了广泛的关注和讨论。
UI设计师在AI时代面临挑战,Figma引入AI功能,如用语言生成UI界面、视觉搜索、自动命名图层等,提高设计效率,但也可能导致设计同质化。Figma还推出Slides功能,直接竞争Canva。AI提升了UI设计的下限,也要求设计师提高专业素养和创意能力。
第一季度结束的时候,Stability AI的营收不到500万美元,亏损超过3000万美元。此外,他们还拖欠云计算供应商和其他公司近1亿美元的账单,可以说,Stability AI已经乱成一锅粥了。
Adobe Firefly 3的发布,结合前段时间发布的SD3,让我有了再一次搞一个AI绘图大模型竞技场,评测一下的想法。在现在这个节点,过了近半年的时候,来再看一下现在进化过的巨头们,已经达到了什么样的水平。四家分别为:Midjourney V6、Adobe Firefly 3、Stable Diffusion 3、Dalle 3。从细节质量、审美(构图色彩等)、语义理解这三个维度来评测,剔除掉了风格多样化这个指标(没法测)。
为CCTV6电影频道AI影像人才优选计划制作AI短片《玉覆荆楚》,结合游戏元素与荆州博物馆文物,讲述游戏、文物、坚守、传承的故事。制作过程中,团队经历了剧本创作、分镜设计、AI生成图像、图像转视频、剪辑和音效制作等环节,克服了多种困难。虽然作品有提升空间,但团队对结果感到满意,并对未来AI影像制作充满信心。
文章讨论了世界3D渲染大赛的作品,指出这些作品展现了高水平的技术和创意,与AI生成的视频相比,渲染作品展现了更多的细节和可控性。作者认为AI在视频制作上降低了门槛,但在商业化交付中的可控性是关键,预估AI影响顶级作品还需2-3年,呼吁不要高估技术短期影响,也不要低估长期影响。
商汤科技利用如影数字人技术在年会上复活了已故的汤晓鸥教授,让他以数字化形式继续进行他的脱口秀,触动了人们的情感。这件事展示了AI技术的意义,即创造新的回忆,延缓遗忘,保持对逝者的怀念。