OpenAI本周推出开发者应用集成功能,允许用户直接通过ChatGPT与第三方应用交互。Spotify成为首批合作伙伴之一,用户可要求ChatGPT创建播放列表、推荐歌曲等。连接账户后,AI可访问用户喜好和听歌历史,提供个性化建议。该功能支持145个国家的所有ChatGPT用户使用,但需注意数据隐私风险。
量子计算机制造商IonQ宣布将从投资公司Heights Capital获得20亿美元融资。该公司计划通过以每股93美元的价格出售1650万股股票筹集约四分之三的资金。Heights Capital还购买了4500万份认股权证。IonQ目前的旗舰产品是包含36个量子比特的Forte Enterprise量子计算机,正在开发性能更强的Tempo芯片。公司还收购了Oxford Ionics等量子硬件开发商,计划在2027年构建包含1万个量子比特的系统。
据报道,苹果收购Prompt AI的交易基本确定,该初创公司领导层已召开全体会议讨论协议细节。Prompt的核心产品Seemour将AI技术应用于安防摄像头,可识别特定人员、宠物和物体,发送异常活动警报并提供文字描述。这种收购人才和技术而非整个公司的策略已成为科技巨头在AI领域的常见做法,部分为了避免监管审查。
微软Windows Copilot功能获得重大更新,现在支持直接创建Office文档,包括Word、Excel和PowerPoint文件。此外,新版本还增加了Gmail连接功能,用户可以通过Copilot智能助手管理和处理邮件。这些新功能进一步增强了Windows系统的办公效率和跨平台协作能力。
中国移动合作伙伴江波龙,在中国移动合作伙伴大会上集中展示面向AI、云计算及数据中心的企业级存储方案,与产业链伙伴合创AI+时代。
这项研究开发了Hi3DEval系统,这是首个能够从整体、局部和材质三个层面全面评估3D模型质量的智能系统。通过创新的视频分析和3D几何特征结合方法,系统在各项评估指标上都显著超越了传统方法,为3D内容创作提供了标准化的质量检测工具,在游戏开发、虚拟现实、电商展示等领域具有广阔的应用前景。
电子科技大学等多所院校联合开发的RPCANet++系统,通过巧妙结合传统数学理论与深度学习技术,实现了既高效又可解释的稀疏物体分割。该系统在红外小目标检测、医学血管分割、工业缺陷检测等多个领域表现优异,为构建可信赖的AI视觉系统提供了新思路。
波兰科学家开发GENIE技术,首次实现既能产生电影级超逼真画面又能实时编辑的3D渲染系统。该技术巧妙融合神经辐射场和高斯点云两种方法的优势,通过创新的飞溅网格编码和光线追踪搜索算法,让虚拟场景可以像橡皮泥一样随意塑造,同时保持照片级的视觉质量。这项突破性技术有望革命性改变电影制作、游戏开发、虚拟现实等领域的内容创作方式。
这项由EleutherAI和英国AI安全研究所合作完成的研究提出了革命性的AI安全解决方案——通过在训练阶段过滤危险内容来构建本质安全的AI模型。研究团队开发了高效的数据过滤系统,成功训练出能够抵抗强力对抗攻击的AI模型,在保持通用能力的同时实现了前所未有的安全性,为开源AI模型的安全发展提供了切实可行的技术路径。
这项由格拉斯哥大学等顶尖高校联合开展的突破性研究,首次系统性提出了"自进化AI智能体"概念框架,将AI发展划分为四个阶段并提出三定律指导原则。研究详细阐述了从单智能体到多智能体系统的优化方法,涵盖思维能力、记忆管理、工具使用等多个维度,并分析了生物医学、编程、金融法律等专业领域的定制化应用,为构建能够持续学习和自我改进的下一代AI系统提供了理论基础和实践指导。
阿里巴巴研究团队开发的Omni-Effects系统,通过创新的专家架构和空间感知技术,首次实现了AI系统同时制作多种视觉特效并精确控制其位置的能力。该系统包含55种特效类型,在测试中达到97%的特效生成准确率和88%的空间控制精度,大幅降低了专业特效制作的技术门槛,为影视制作、教育、营销等领域提供了强大的创作工具。
Mirage是由Captions公司开发的革命性AI视频制作平台,用户只需用文字描述创意想法,系统就能自动生成专业水准的短视频内容。该技术基于专门训练的AI模型,深度理解社交媒体视频的节奏和吸引力法则。目前拥有超过10万日活用户和2000万注册用户,每月产生300万个视频。平台提供个人版Captions应用和企业版Mirage Studio,后者支持大规模内容制作和快速A/B测试,正在重新定义数字内容创作的门槛和效率。
这项由复旦大学等机构合作完成的研究提出了CodeI/O方法,通过让AI学习预测代码的输入输出来提升通用推理能力。该方法将45万个代码文件转化为350万个训练样本,让AI用自然语言推理代码逻辑,从而掌握逻辑规划、状态搜索等推理技能。实验显示,在14个评测基准上,CodeI/O训练的模型在符号、科学、逻辑、数学等推理任务上都实现了均衡显著的性能提升。
这项由俄罗斯AIRI实验室主导的突破性研究发现,AI模型的单个记忆向量能够完美压缩和复原多达1568个文本片段,压缩比达到1500倍。研究测试了14个不同模型,揭示了AI系统巨大的未开发记忆潜力,但当前利用率仅30%。这一发现不仅挑战了对AI记忆机制的传统认知,更为未来更高效的AI系统设计开辟了新方向,有望让AI助手拥有更强的长期记忆和信息处理能力。
清华大学与阿里巴巴合作开发的S?-Guidance技术,通过创新的"随机自引导"方法解决了AI图像和视频生成中的质量问题。该技术无需额外训练,仅通过随机屏蔽模型部分功能来创建内部"顾问",指导AI避免低质量输出。实验显示在多个评估维度上显著超越传统方法,人类专家评价中获得31%偏好率,计算开销仅增加20%。
这项由上海人工智能实验室等多家国际机构联合完成的研究系统性地梳理了大语言模型高效架构的最新进展。论文将创新方法分为七大类:线性序列建模、稀疏序列建模、高效全注意力、稀疏专家混合、混合架构、扩散语言模型和跨模态应用。研究揭示了如何在保持AI能力的同时大幅降低计算成本,为AI技术的可持续发展和广泛应用提供了重要指导。
浙江大学团队推出TINKER系统,实现仅用一张或几张图片就能完成高质量3D场景编辑,无需针对每个场景进行专门训练。该系统解决了多视角一致性难题,创建了首个大规模多视角编辑数据集,在编辑效果和计算效率上全面超越现有方法,为3D内容创作的普及化奠定了技术基础。
中科院深圳先进技术研究院团队首次全面梳理了大型语言模型评测领域,分析了283个代表性基准,将其归纳为通用能力、领域专业和特定目标三大类别。研究揭示了现有评测体系面临的数据污染、文化偏见和静态评测等关键挑战,为构建更科学公正的AI评测框架提供了重要指导,推动人工智能技术向更安全可靠的方向发展。
Meta与卡内基梅隆大学联合开发的ATLAS系统革命性地解决了3D人体建模中的核心难题。通过将人体骨架和表面分离处理,ATLAS实现了精确的独立控制,避免了传统方法中调整一个部位影响其他部位的问题。该系统基于60万高分辨率扫描数据训练,采用创新的稀疏非线性姿态校正技术,能从单张照片生成精确3D模型,为虚拟现实、游戏制作、在线购物等应用提供强大技术支撑。