三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。
传统财务指标和KPI就像通过后视镜驾驶组织。医疗AI公司Corti的CEO安德烈亚斯·克莱夫提出"奇异指标"概念,通过分析Slack等平台的沟通模式来衡量创新步伐。这种方法监控消息数量、识别信息孤岛、确保横向沟通,帮助Corti做出更有效的战略决策。虽然实时指标很重要,但公司仍需通过定期董事会议等方式平衡短期洞察与长期愿景,在前瞻性与回顾性指标间找到平衡。
南洋理工大学与腾讯联合研究团队开发出Rolling Forcing技术,实现AI视频实时流式生成的重大突破。该技术通过滚动窗口联合去噪、注意力锚点机制和高效训练算法三项创新,解决了长视频生成中的错误累积问题,可在单GPU上以16fps速度生成多分钟高质量视频,延迟仅0.76秒,质量漂移指标从传统方法的1.66降至0.01,为交互式媒体和内容创作开辟新可能。
JetBrains发布开发者生态系统调查报告,收集超过24500份回复,揭示了AI对开发工具和编程语言趋势的影响,声称PHP和Ruby正处于"长期衰落"。调查显示68%的开发者认为AI技能将成为工作要求,85%使用AI编码工具,ChatGPT最受欢迎。然而仅44%开发者在工作流程中完全或部分采用AI。调查还指出TypeScript五年来显著增长,而PHP、Ruby和Objective-C处于长期衰落趋势。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。
中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。
OpenAI发布ChatGPT Atlas AI浏览器,支持网页问答、历史查询和邮件改写等功能。同时曝光秘密项目Mercury,雇佣约100名前投行精英以每小时150美元训练AI金融模型。公司还因用户滥用Sora生成马丁·路德·金视频而暂停相关功能。此外,医疗AI搜索引擎OpenEvidence获2亿美元融资,估值60亿美元。
新加坡国立大学研究团队发现现代AI推理模型存在意外困境:传统的推理示例反而会降低性能,最高降幅达35%。研究识别出两个关键问题并开发了I2S解决方案,通过将示例转化为抽象指导而非具体模仿,在多个模型上实现显著提升。该方法轻量级、免训练,为AI推理能力优化开辟新思路。