这项由以色列理工学院和IBM研究院合作的研究提出TASTE方法,通过先采样多样化工具操作序列、再合成对应任务的反向出题思路,构建了更难、覆盖率更高的AI测试集,让原本高分AI成绩大幅下跌。
华为研究团队提出LVSA,一种无需重训练的稀疏注意力机制,通过全局锚点帧与局部窗口帧结合,使视频生成速度提升最高3.3倍,同时解决长视频画面"冻结"问题。
新加坡国立大学提出FINEVERIFY框架,将复杂问题拆解为可核查子问题,逐条取证后汇总评分选择最优答案,在四个搜索基准上稳定超越多数投票等主流方法。
微软近期大幅调整GitHub Copilot定价策略,从固定费率改为按Token计费,引发业界震动,被网友戏称为"Token末日"。TechCrunch播客讨论指出,随着Anthropic等AI公司筹备IPO,盈利压力将推动更多AI产品涨价并限制用量。Uber等企业已因AI支出超预算而被迫设限。分析人士认为,AI实验室若要存活,必须像Uber一样经历深刻的商业模式转型,但降本之路更为艰难。
NVIDIA与斗山集团宣布扩大合作,涵盖斗山机器人、斗山山猫、斗山重工及斗山公司电子材料事业部。双方将整合NVIDIA全栈加速计算平台与斗山在工业自动化、电力及电子材料领域的能力。合作内容包括:斗山机器人接入NVIDIA Isaac Sim等框架推进智能机器人OS;斗山重工探索AI工厂大规模供电解决方案;斗山电子材料则为AI数据中心提供高性能覆铜板基础材料。
下一代光传送网产业与技术标准推进委员会(CCSA TC618)暨新一代光传送网发展论坛(NGOF)的“超宽带超高速光通信关键技术与产业发展技术研讨会”与“面向光电融合的超高速光模块/器件技术发展研讨会”在北京顺利召开。
STATE16公司研究者设计了一套运行时"物理审查门",在AI机器人执行预测动作前检查其是否物理可行,实验显示可拦截87%-89%的非法动作方案,同时保留近乎完整的任务进度。
ChartArena是腾讯等机构联合发布的图表解析评测基准,覆盖8种图表类型、3种视觉场景和双语内容,并设计了格式无关的统一评估协议,系统评测了26个主流AI模型。
写一篇自己也不完全懂的笔记。虽然不完全懂,但看完确实有收获,懂的人应该能收获更多。
大众汽车旗下ID. Polo与Cupra Raval已在西班牙马托雷尔工厂正式下线投产。两款车型起售价分别为24,995欧元和26,000欧元,均基于MEB+平台打造,搭载37kWh或52kWh电池组,续航里程最高可达454公里。这是大众"电动城市车家族"系列的首批产品,预计今年夏末秋初开始交付。大众集团通过跨品牌资源整合,实现约6亿欧元的成本节约,后续还将推出ID. Cross等新成员。
三星宣布将于6月8日起为Samsung Health应用推出重磅功能更新,赶在Galaxy Watch 9传闻发布之前落地。新版本将引入多项AI驱动的生物特征分析功能,包括:综合心率、血氧、皮肤温度等数据的每日活力评分(Vitals)、结合体成分数据评估长期心脏健康的心脏健康评分、优化训练强度的每日有氧负荷追踪,以及横向对比用户群体的健身指数。此外,应用界面将重新划分为睡眠、营养、活动、正念和体征五大板块,并新增抗氧化指数、年龄指数和听力保护等个性化功能。
据《连线》杂志调查并经EFF威胁实验室证实,Meta已在其智能眼镜配套应用中嵌入面部识别代码。该功能内部代号"NameTag",可将眼镜摄像头捕捉的人脸转化为生物特征信息,并与本地数据库比对,向佩戴者推送相关人员信息。目前该功能尚未向用户开放,Meta表示尚未做出正式上线决定。EFF警告称,此举将用户变为"分布式监控工具",引发隐私界高度关注。
谷歌研究院与谷歌云联合推出全新Agentic RAG框架,搭载于Gemini企业智能体平台。该框架通过多智能体协作,将复杂查询分解并迭代检索,引入"充分上下文智能体"进行质量把控,确保信息完整后再生成答案。在FramesQA数据集测试中,跨语料库准确率达90.1%,较标准RAG在事实性数据集上准确率提升最高34%,显著增强了企业级AI应用的可靠性与可溯源性。
麻省理工学院计算学院SERC计划于4月30日举办全天研讨会,聚焦AI对社会的影响与伦理责任。会议涵盖AI对齐、教育应用、空气污染预测等议题。学者们探讨了如何将人类价值观融入AI系统、教育中AI工具的合理使用边界,以及人机协作时的认知差异问题。与会者强调,随着AI深度嵌入社会各层面,技术进步与伦理反思必须同步推进,人的核心作用不可或缺。
亚马逊AWS研究团队开发了一种名为"弹性网络图"(RNG)的全新路由架构,自2024年4月起已成为多数新建AWS数据中心的默认方案。该架构采用"准随机"拓扑结构,结合新型"SprayPoint"路由算法与"ShuffleBox"设备,在减少69%交换机数量的同时提升33%吞吐量,并将网络基础设施电力消耗降低40%。首个部署节点已于2024年底在爱尔兰都柏林投入生产运行。
据Mark Gurman报道,iOS 27将对多款iPhone应用进行设计更新。其中相机和Image Playground变化最大:相机应用将支持完全自定义布局,并新增Siri视觉智能模式;Image Playground则经过全面重新设计,优化了图库界面与图像创作控件。此外,"查找"、天气和Safari也将获得小幅设计改进。在Liquid Glass方面,iOS 27将调整标签栏,把搜索功能重新整合回导航栏,影响音乐、播客等多款应用。
Marvell CEO墨菲在Computex上指出,AI基础设施的核心挑战已从算力和内存转向"互联互通"。随着数据中心连接从铜缆升级为光学互连,全新架构可能性正在开启。Marvell数据中心业务已占其总收入的约75%,预计明年营收达164亿美元。与此同时,SK Hynix计划5年内将存储晶圆产能翻倍,西班牙电信与谷歌云推进主权云合作,AI基础设施建设持续加速。
Meta于今年4月发布了其首款闭源大语言模型Muse Spark,并承诺API接口"即将推出",但两个月过去仍未兑现。Meta发言人表示API将于6月正式开放,目前已与部分早期合作伙伴展开测试。这是Meta首款非开源模型,无法像以往模型那样被自由使用。分析认为,API发布延迟可能影响外界对Meta实现AI商业化计划的信心。
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。