宏碁在台湾Computex 2025展会上发布了一系列配备AI技术的穿戴及移动产品,包括健康监测戒指、实时翻译耳机和智能电动车,助力健康管理与便捷出行。
该文探讨 CIAM 如何突破传统 OAuth 集成瓶颈,助力企业 AI 代理自动化接入和第三方平台整合,实现流程自动化、成本降低及安全合规提升。
分析报告预测磁盘驱动器容量出货量至2030年将显著增长,尽管笔记本和PC市场受SSD影响,但大容量近线HDD仍保持稳定市场;Western Digital、Seagate和Toshiba三家厂商表现各异。
本文探讨了AI编程代理如何加速软件开发,从代码调试到云迁移自动化,借助如AWS Transform等工具提升效率并降低转型成本。
文章阐述具代理性 AI 在推动人机协作、优化业务流程中的应用前景,主张培训 AI 技能、调整工作模式并强化监督,助力企业创新转型。
华为围绕F5G-A构建覆盖"研、营、销、供、服"全周期的伙伴支撑体系,赋能伙伴抓住园区网络“以光惠算”大机遇。
这篇研究介绍了Meta公司开发的J1系统,这是一种通过强化学习训练大语言模型进行评判的创新方法。J1将可验证和不可验证的提示转换为具有可验证奖励的判断任务,从而鼓励模型在做出决策前先进行思考。研究表明,J1在8B和70B参数规模下都超越了同等规模的现有模型,甚至在某些测试中超过了更大的模型如o1-mini和DeepSeek-R1。这种方法的核心创新在于不仅优化最终判断,还优化思考过程本身,使模型学会制定评估标准、生成参考答案并重新评估回答的正确性。
北京人工智能研究院等机构研究团队提出的"端到端视觉令牌化调优"(ETT)方法解决了视觉令牌化器在多模态任务中的表示瓶颈问题。与传统方法不同,ETT利用令牌化器码本嵌入代替离散索引,并通过重建和描述目标端到端优化视觉令牌化器。实验表明,该方法在保持重建能力的同时,为多模态理解和视觉生成任务带来2-6%的性能提升,显著超越现有离散令牌化方法,甚至接近连续编码器的性能。
浙江大学和香港大学的研究团队提出了Prior Depth Anything,一个创新框架,融合了深度测量中精确但不完整的度量信息与深度预测中相对但完整的几何结构。该方法通过粗到细的流程,先用像素级度量对齐将深度预测与先验融合,再利用条件化单目深度估计模型优化结果。模型在7个真实数据集上实现了出色的零样本迁移,可处理深度补全、超分辨率和修复任务,甚至能应对混合先验情况,并支持测试时切换预测模型,提供灵活的精度-效率权衡。
一项由苏州大学、微软等机构合作的研究OPENTHINKIMG首次提出了完整的视觉工具强化学习框架,解决了当前大型视觉语言模型缺乏视觉思维的问题。该研究基于Qwen2-VL-2B基础模型,开发了V-TOOLRL方法,通过分布式工具部署、轨迹生成和强化学习,使AI能像人类一样"用图像思考"。实验表明,在图表推理任务上,该方法准确率达59.39%,显著超越了同类开源系统并优于GPT-4.1,为未来AI视觉认知提供了新路径。代码已在GitHub开源,将促进相关领域研究。
这项研究探索了将大型语言模型(LLM)与扩散变换器(DiT)深度融合用于文本到图像生成的新方法。纽约大学和Hugging Face的研究团队没有提出全新技术,而是系统分析了现有方法的设计空间和关键参数选择。研究发现深度融合模型在图像-文本对齐方面优于传统方法,特别是在移除时间步调节和采用混合位置编码策略后性能显著提升。他们的FuseDiT模型在有限数据和计算资源下仍达到了与顶级系统相当的性能,为多模态生成提供了实用指南。
ReSurgSAM2是新加坡国立大学团队开发的两阶段手术视频分割系统,允许外科医生通过文本指令精准识别和追踪手术器械与组织。这项创新利用SAM2模型为基础,添加了跨模态空间-时间Mamba、可靠初始帧选择和多样性驱动长期记忆机制,解决了现有技术在长时间追踪和实时性能方面的局限。实验表明,该系统在准确性上显著超越现有方法,同时保持61.2 FPS的实时处理能力,为手术认知辅助、教育和导航提供了强大工具。
Waymo 因发现无人驾驶出租车在低速行驶时撞击大门、链条等固定障碍物,召回了其中 1,200 辆车辆,并通过软件更新降低风险,满足监管要求。
本文探讨了 AI 数据中心如何利用直冷技术应对 GPU 高功率散热和电力分配挑战,通过 Supermicro 的 DLC-1 与 DLC-2 系统实现能耗降、噪音减。
Acorns收购了家庭投资赠礼平台EarlyBird。收购后平台将关闭,创始人加入Acorns团队,助力打造儿童理财App Acorns Early,并整合数字时间胶囊功能,助全家传承财富。
Cognichip 正在构建基于物理知识的基础 AI 模型,以加速新芯片的研发,降低成本,并帮助半导体企业实现转型。