滑铁卢大学推出的Interactive Training框架革命性地改变了神经网络训练模式,让训练从"烤箱式"的固定参数变为"炒菜式"的实时调控。系统通过控制服务器、交互式训练器和前端界面实现人机协作,仅需三行代码修改即可集成。三个验证案例展示了人类专家干预、AI代理自动优化和实时数据更新的强大效果,为AI训练带来前所未有的灵活性和响应能力。
腾讯AI实验室提出VOGUE方法,通过让AI系统同时处理原图和轻微噪声图像,利用输出差异作为"视觉不确定性"信号指导探索学习。该方法在多个基准测试中显著提升了多模态AI的推理准确率,为构建更可靠的人工智能系统开辟了新路径,使AI在面对真实世界中各种质量图像时能保持稳定表现。
俄国科学家发现AI精准控制技术"激活引导"存在严重安全漏洞,即使随机控制信号也能让安全AI模型回答有害问题,遵从率可达27%。更令人震惊的是,用于合法目的的"良性"控制特征比随机信号更危险,且攻击者只需20个简单向量就能创建通用攻击工具。这项研究颠覆了"可解释AI更安全"的基本假设,警示精确控制并不等于安全控制。
腾讯AI实验室发布CLUE验证系统,通过分析AI模型内部"思维轨迹"的几何特征来判断答案正确性。该系统发现正确和错误的推理过程在AI隐藏状态空间中呈现不同的几何模式,无需训练即可实现有效验证。在数学竞赛测试中,CLUE将准确率从56.7%提升至70.0%,且在物理、法律等多领域均表现出色。研究还揭示强化学习训练的模型具有更清晰的内部几何结构,为AI系统设计提供新思路。
法国IlluinTechnology等机构的研究团队开发出ModernVBERT,一个仅有2.5亿参数的视觉文档检索模型,性能可媲美10倍大小的模型。该模型采用双向注意力和晚期交互技术,在CPU上运行速度比同类产品快7倍,解决了大型模型资源消耗过大的问题。团队通过精心设计的三阶段训练和创新的数据混合策略,让小模型实现了卓越的检索性能,为资源受限环境下的AI应用提供了新解决方案。
西湖大学王欢教授团队开发出REWARDMAP训练框架,通过多阶段强化学习和细节奖励机制,显著提升AI在复杂地图导航等视觉推理任务中的表现。该方法构建了包含4018个问题的REASONMAP-PLUS数据集,采用循序渐进的训练策略,让AI像人类一样从基础感知逐步发展到复杂推理能力,在多项测试中实现3.47%的平均性能提升。
蚂蚁集团联合上海交通大学研发的F2LLM文本理解模型,仅用600万开源数据就达到了与使用数亿数据的顶级模型相当的性能。该模型在MTEB评测中表现优异,4B版本排名第7,1.7B版本在同等规模中排名第1。研究团队采用创新的单阶段训练策略和精心的数据筛选方法,实现了性能、成本和效率的完美平衡。更重要的是,整个项目完全开源,为AI技术普及和民主化做出了重要贡献。
Simular Research团队提出革命性bBoN方法,通过让多个电脑智能体协同工作并从中选择最佳方案,将任务成功率从60%提升至接近人类水平的69.9%。该方法将复杂操作转换为简洁叙述,采用比较式判断机制,在Ubuntu、Windows和Android三大平台均取得显著性能提升,为AI助手的实用化发展指出了新方向。
NVIDIA研究团队开发了RLP强化学习预训练方法,让AI在学习过程中就养成思考习惯。与传统训练只关注预测下一个词不同,RLP让AI每次回答前都先生成思考过程。实验显示,该方法在数学和科学推理上带来19-35%的显著提升,且适用于各类文本数据,训练成本低廉。这项突破有望改变AI训练范式,让AI具备真正的推理思考能力。
上海AI实验室联合多所顶尖高校发布全球首个深度研究智能体评估基准Rigorous Bench,包含214个高难度任务,从语义质量、主题聚焦度和检索可信度三个维度评估AI生成研究报告的能力。实验证明深度研究智能体显著优于传统搜索增强模型,为AI向真正智能研究助手发展奠定了评估标准基础。
今日,亚马逊云科技第三期创业加速器项目圆满收官。35家入营企业齐聚一堂,分享了各自的业务发展情况,以及参与本期加速器的收获及体验。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
苹果即将发布Apple TV 4K和HomePod mini 2两款产品更新。更值得期待的是三款全新产品:配备7英寸方形显示屏的HomePod Touch将搭载全新homeOS系统,支持Safari、音乐等应用及小组件功能,预计售价350美元;此外还有智能安全摄像头和视频门铃两款配件。这标志着苹果从依赖第三方HomeKit配件转向自主研发智能家居产品的重要战略转变。
数据编排和GPU数据供给商Hammerspace宣布采用英伟达AI数据平台参考设计,为AI代理提供数据基础。该公司将其AI数据平台集成到全球数据环境产品中,实现跨多厂商存储孤岛的文件和对象数据虚拟化。平台具备单一全局命名空间,支持基于活动级别的数据放置决策,包括零层存储和GPU Direct快速数据供应。系统确保训练和推理工作负载能即时访问所需数据,无需手动数据移动。该解决方案将于2025年底通过授权合作伙伴提供。
台湾新唐科技发布NuMicro M55M1微控制器,集成Arm Cortex M55处理器和Arm Ethos U55神经处理单元,可在低功耗环境下处理语音触发、姿态识别、手势识别和视觉任务,无需云端连接。该芯片运行频率220MHz,支持本地机器学习推理,适用于智能玩具、门铃等简单AI应用场景,为嵌入式设备提供离线AI能力。
数十年来,命令行界面一直是IT管理的基石,但智能代理AI技术正在颠覆这一模式。通过自然语言指令,IT专业人员可以直接向AI代理下达任务,无需掌握复杂的命令语法。尽管CLI在精确控制、性能和资源效率方面仍有优势,但随着AI工具日趋成熟、学习成本降低,智能代理有望成为常规管理任务的默认解决方案,传统命令行技能可能逐渐过时。
OpenAI宣布与微软达成协议,将重组为公共利益公司并进行资本重组。微软将持有OpenAI约27%股份,价值约1350亿美元,投资回报达10倍。OpenAI承诺在Azure云服务上投入2500亿美元,但微软将失去计算任务优先权。新架构下,非营利组织OpenAI基金会将控制约26%的公共利益公司股权,价值约1300亿美元。尽管公司估值达5000亿美元,但从未实现盈利。
Qorvo今日宣布,两家公司已达成最终协议,将通过现金与股票交易完成合并。该交易将合并后的企业估值约为 220 亿美元,旨在共同打造一家总部位于美国且全球领先的高性能射频、模拟及混合信号半导体公司。
Akamai宣布推出Akamai Inference Cloud,该平台通过将推理从核心数据中心扩展到互联网边缘,重新定义了应用 AI 的场景与方式。
新加坡国立大学等机构研究团队发现AI多智能体协作中存在"视觉幻觉雪球"现象,即错误信息在AI团队中像传话游戏一样逐步放大。研究提出ViF视觉流解决方案,通过直接传递关键视觉信息而非仅依赖文字描述,显著减少了幻觉现象,性能提升2.4%-3.8%,为AI团队协作可靠性提供重要保障。
 
             
                 
                     
                     
                    