WordPress.com母公司Automattic继收购通讯应用Beeper和Texts.com后,又收购了关系管理应用Clay。Clay是一款智能通讯录应用,能从LinkedIn、Facebook等平台整合联系人信息,并配备AI助手Nexus。该应用于2021年推出,此前融资超900万美元。收购完成后,Clay将继续运营并与Automattic其他产品集成,长期计划是成为各种工具的身份层。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。
这项由Sierra公司联合多伦多大学开展的研究首次揭示了AI对话系统在双控制环境下的真实挑战。研究团队发现,当AI需要指导用户协作操作时,性能会显著下降约20%。他们开发的τ?-bench评估平台通过电信技术支持场景,系统性地测试了AI的协作指导能力,并通过程序化任务生成和环境约束的用户模拟大幅提升了评估可靠性,为未来人机协作AI系统的发展指明方向。
德州农工大学等多所知名高校联合Meta公司推出的SAFEFLOW框架,为AI智能体首次提供完整安全保障体系。该系统通过信息流控制、事务日志和动态信任评估,解决了当前AI助手易受欺骗、缺乏协调的关键问题,在专门构建的测试平台上实现了接近完美的安全表现。
Warp成立于2021年,致力于通过技术赋能的物流网络优化企业供应链。该公司现计划使用机器人自动化其仓储网络,进一步提升供应链效率。公司在洛杉矶测试仓库安装摄像头,利用计算机视觉技术创建数字孪生环境进行实验。经过测试,Warp成功部署改装后的现成机器人处理货物装卸和存储。公司刚完成1000万美元A轮融资,计划今年开始在核心网络城市部署机器人技术。
Meta本周发布了名为V-JEPA 2的开源生成式AI模型,该模型能够帮助人工智能理解重力和物体永恒性等物理概念。与依赖标记数据或视频模拟现实的传统模型不同,V-JEPA 2强调物理世界的逻辑,包括物体如何移动和相互作用。该模型可应用于自动驾驶汽车和机器人等设备,无需针对每种可能情况进行训练,简化了流程并提高了现实应用的效率。
文章探讨了人类与人工智能协作的复杂关系。研究显示,面对"如何与AI竞争"这一问题,66%的受访者认为应该利用AI进行协作,而非对抗。以学生群体为例,调查发现一半青少年使用生成式AI进行搜索和头脑风暴,虽存在作弊现象,但更多体现了积极的学习应用。专家建议保持好奇心,采用"宏大梦想,小步迭代"的策略,通过深入理解技术来建立最佳协作关系。
随着摩尔定律接近极限和数据中心功耗问题日益突出,AMD制定了到2030年将芯片能效提升20倍的宏伟目标,并将机架级架构视为关键设计方向。AMD高级副总裁表示,设备规模越大效率越高,机架级计算能将整个机架的计算设备集成到单一封装中。AMD计划明年推出首个机架级计算平台MI400,未来五年内光学互连可能取代铜质连接。除硬件创新外,软硬件协同设计将是实现目标的关键因素。
斯坦福大学研究团队开发出SynthesizeMe方法,能让AI通过观察用户的选择自动学习个人偏好,无需填写复杂资料。该方法通过三步流程分析用户互动,生成个性化画像,在理解用户偏好方面准确率提升4.4%。研究还构建了PersonalRewardBench测试平台,为AI个性化能力评估提供标准。这项技术有望应用于智能客服、教育和内容推荐等领域。
普渡大学研究团队首次提出AI模型免疫技术,通过条件数理论让模型能够抵抗恶意训练。该方法在保持正常功能的同时,显著增加恶意微调的难度,实验显示免疫效果可达40倍以上。这项突破性研究为AI安全提供了"预防胜于治疗"的新思路,开创了模型免疫这一全新技术方向。
约翰霍普金斯大学研究发现,AI大模型存在严重的"记忆偏见"问题,即使明确指示忽略内部知识,AI仍会固执地依赖训练时的记忆。研究通过创新的诊断框架测试了三种AI模型,发现知识冲突会显著降低模型性能,且这种偏见会影响AI用作评判工具的公正性。
爱丁堡大学研究团队发现现有视觉语言模型难以准确预测现实世界变化,创新性地提出"师傅带徒弟"训练策略。通过让擅长反向推理的动态模型指导世界模型学习,在多个真实场景测试中超越专业图像编辑模型15%。该方法包括合成数据生成和推理时验证两种策略,为人工智能理解物理世界变化提供新思路。
约翰斯·霍普金斯大学研究团队发现让AI通过玩贪吃蛇等简单游戏进行强化学习训练,竟能显著提升其在数学推理等完全不同任务上的表现。这种名为ViGaL的训练方法无需任何数学训练数据,却在多项测试中超越了专门用数学题目训练的AI模型,展现了游戏训练培养通用推理能力的巨大潜力。
新加坡南洋理工大学研究团队首次提出概念感知微调方法,让AI同时预测多个词块而非单一词块,从而更好理解完整概念。该方法在编程、数学、文本生成、分子设计和蛋白质设计五大领域均显示显著改进,将多词块预测技术首次引入模型微调阶段,大幅降低成本门槛,为AI训练范式变革提供新思路。
北京大学团队提出ReLIFT方法,巧妙结合强化学习与监督学习优势。该方法让AI在常规训练中自主练习,遇到最难题目时自动获取高质量指导。实验显示ReLIFT在五个数学竞赛测试中平均提升5.2分,仅需传统方法13%的教学数据,生成答案长度减少近10倍,为AI突破能力边界提供新路径。
这项由斯坦福大学、Meta公司和密歇根大学联合完成的研究,开发了能够实时观看视频并主动提供任务指导的AI助手系统。研究团队创建了包含30万对话的PROASSIST数据集,设计了创新的评估方法,并开发了能处理流媒体视频的端到端模型。实验显示,该系统能够在烹饪、组装等多种任务中提供及时准确的指导,为开发真正智能的人工助手奠定了基础。
Multiverse Computing宣布完成2.15亿美元B轮融资,用于加速部署其量子计算启发的AI模型压缩技术。该技术可将大语言模型体积缩小95%而不影响性能表现,大幅降低AI推理成本。公司的CompatifAI技术采用量子启发算法和先进张量网络,能识别并剔除AI模型中的冗余部分。压缩后的模型运行速度提升4-12倍,推理成本降低50%-80%,可在云端、本地数据中心甚至边缘设备上运行。
苹果研究表明,模拟推理模型在高难度问题上多依赖模式匹配而非真正推理,这与 USAMO 最新发现不谋而合。
Databricks联合创始人兼CEO Ali Ghodsi在Data+AI Summit上宣布了多个新产品,如Agent Bricks和Lakebase,旨在简化企业AI应用开发、降低高成本及解决数据平台锁定问题。