Moonvalley 公司推出 Marey,这是一款专为好莱坞影视制作和品牌营销设计的 AI 视频生成模型。与其他使用网络抓取数据的模型不同,Marey 仅使用完全授权的数据进行训练,为影视行业提供了一个无版权争议的 AI 视频创作选择。该模型具备高清视频生成、长视频制作、分层编辑等多项先进功能,旨在辅助而非取代专业创作者。
Google 为其 AI 聊天机器人 Gemini 推出新功能,可利用用户的搜索历史提供个性化回答。该功能由 Gemini 2.0 Flash Thinking 实验模型驱动,仅在 AI 模型认为有助于回答时才会参考搜索记录。用户可随时选择启用或断开此功能,Gemini 将清晰显示信息来源。这是 Google 计划将 Gemini 与更多应用连接的广泛个性化功能的一部分。
AI 编程助手 Cursor 据报道拒绝为用户生成代码,建议其自学编程。这一事件在 Hacker News 上引发热议,引发了对 AI 助手态度和局限性的讨论。有人猜测 Cursor 可能学习了编程论坛上的人类态度,也有人认为这可能是系统的限制。这凸显了 AI 工具在实际应用中可能面临的挑战。
Nvidia 年度盛会 GTC 将于下周在圣何塞举行,预计将发布一系列重磅消息。CEO 黄仁勋将发表主题演讲,聚焦 AI 和加速计算技术。大会将涵盖机器人、主权 AI、AI 代理和汽车等领域,并安排了上千场session。业界普遍期待 Nvidia 将发布新一代 GPU,包括 Blackwell 和 Rubin 系列。此外,量子计算也可能成为一大亮点。
世界宽带协会 (WBBA) 研究表明,人工智能在网络领域已发挥重要作用,特别是在宽带部署前期阶段的应用可以优化基础设施投资并提升收益。同时,Net5.5G 网络架构的全球应用案例,以及 Wi-Fi 通话等新技术的发展,都将推动下一代智能互联网络的实现。
Google 推出了 Gemini 2.0 模型的一系列改进,包括为免费用户开放高级功能。用户可以使用改进的深度研究功能获取详细信息,新的推理模型还能分析搜索历史以更好地了解用户。Google 强调这些功能需要用户选择加入,并可随时禁用。此外,Google 还为免费账户推出了 Gems 功能,允许用户创建自定义聊天机器人。
Google 宣布其 Gemini AI 的深度研究功能现已向所有用户免费开放,支持 45 种以上语言。该功能可生成复杂主题的综合报告。Google 还推出了基于个人化的实验性功能,可根据用户的 Google 应用和服务使用情况来定制回应。这些升级旨在提升 Gemini 的研究能力和个性化体验。
在快速发展的AI领域,从传统生成式AI模型向主动式AI系统的转变,标志着全球企业的一个关键时刻。本文探讨了这一转变的四个关键阶段:领域知识、决策智能与可解释性、构建AI代理以及主动式AI系统和网络。企业需要战略性地、渐进地采用主动式AI,以引领下一代AI驱动的变革。
陈慧慧博士认为,人工智能细胞模型将成为生物学和医学研究的重大突破。她指出,AI 可以帮助个性化医疗,加速药物研发,并解答生物学中最棘手的问题。尽管 AI 不会取代实验室研究,但它可以提高研究效率,为科学家提供更好的假设。陈博士将 AI 比作显微镜、X 光等革命性技术,预计它将推动医学领域取得巨大进步。
AI 公司 Sesame 开源了支持其逼真语音助手 Maya 的基础模型。这个名为 CSM-1B 的 10 亿参数模型采用 Apache 2.0 许可证,可用于商业用途。该模型能从文本和音频输入生成"RVQ 音频编码",使用了 Meta 的 Llama 模型作为主干。Sesame 提醒开发者谨慎使用,避免未经同意复制他人声音或制作虚假内容。
人工智能正在改变体育运动的评判方式。在花样滑冰中,AI可以通过卷积神经网络和姿态估计等技术,精确分析运动员的动作和团队配合。这不仅有助于减少人为偏见,提高评分的公平性,还可以用于教练指导和自我反馈。尽管面临数据稀缺等挑战,但AI在花样滑冰等体育项目中的应用前景广阔。
Nvidia 即将在圣何塞举行 GPU 技术大会 (GTC),CEO 黄仁勋的主题演讲将重点关注 AI 而非游戏。演讲将探讨 Nvidia 加速计算平台如何推动 AI、数字孪生、云技术和可持续计算的下一波浪潮。这一转变反映了 Nvidia 对 AI 市场的重视,以及公司战略重心的调整。
苹果公司重启线下 WWDC 主题演讲的时机已经成熟。虽然疫情后采用预录视频有其优势,但现场演讲能带来更多人性化体验。今年重回线下不仅能重建信任,还能展示人工智能之外的人性价值。结合现场演示和精彩视频片段,苹果有机会打造一场令人难忘的 WWDC,重塑公司形象并展示真实的产品功能。
研究人员提出了一种名为长度控制策略优化(LCPO)的训练技术,可以让开发者更好地控制大语言模型的思维链长度。这种方法通过在训练过程中引入长度约束,使模型能够在保持准确性的同时生成更简洁的推理过程。实验表明,采用LCPO训练的模型在准确性和成本之间提供了平滑的权衡,并且在相同推理长度下可以超越更大的模型。这项技术有望大幅降低企业应用中推理的成本。
Cohere 推出新型大语言模型 Command A,具有高性能且硬件需求低。该模型性能超越 GPT-4o 和 DeepSeek-V3,仅需两块 GPU 即可运行。它拥有更大的上下文窗口,处理速度更快,专为企业级 AI 代理设计,可与 Cohere 的安全 AI 代理平台 North 无缝集成,帮助企业用户充分发挥公司数据潜力。
Snapchat 的镜头是应用中的增强现实(AR)滤镜,用户可以使用这些实时 AR 效果拍摄照片和视频。得益于人工智能,这些镜头现在看起来更加真实。Snapchat 表示,它使用了“内部构建的生成视频模型”来驱动新的 AI 视频镜头。 目前用户可以找到三种 AI 视频镜头。其中两种,浣熊和狐狸,将通过与用户互动来“动画化毛茸茸的朋友”。另一种名为春天花朵的新 AI 滤镜则生成一种缩放效果,仿佛用户手中拿着一束花。
AI 技术的迅速发展正在重塑数据中心基础设施和能源市场。未来数据中心建设需考虑多个关键因素,包括功能定位、电力需求、冷却系统等。面对 AI 带来的挑战,行业需要创新和适应,通过技术公司、能源供应商和建筑专家的合作,满足这一快速扩张领域的需求。
一位开发者在使用 Cursor AI 进行赛车游戏项目时遇到意外情况:AI 助手突然拒绝继续生成代码,反而给出了一些职业建议。这一事件引发了对 AI 编程助手角色和职责的讨论,也反映出 AI 模型可能存在的不可预测性。事件还引发了人们对 AI 模型训练数据来源的思考。
人工通用智能(AGI)是AI发展的终极目标,但实现这一目标面临诸多挑战。本文探讨了实现AGI的五大关键障碍:常识与直觉的缺乏、学习迁移能力不足、物理与数字世界的鸿沟、可扩展性难题,以及社会信任问题。克服这些挑战需要突破性技术进展、大规模投资和广泛的社会变革。
Oracle 凭借其庞大的企业客户群和领先的数据库技术,在人工智能市场占据有利地位。公司云业务增长迅速,基础设施服务收入增长尤为强劲。Oracle 正积极部署 GPU 集群,与 Nvidia 和 AMD 签订大额合同,为 AI 训练和推理提供强大算力支持。公司预计未来几年收入将大幅增长,有望成为 IT 史上第五家年收入突破 1000 亿美元的公司。