智能网卡(SmartNIC)技术自2013年AWS首次应用以来,虽然获得了VMware、英特尔、AMD和英伟达等巨头支持,但市场表现平平。分析师指出,目前主要客户仍局限于服务提供商。然而,随着AI技术蓬勃发展,情况正在改变。英伟达、红帽等厂商在AI云架构中推荐使用DPU,认为其可优化推理工作负载并提升资源效率,AI革命有望真正推动智能网卡技术普及。
法国Valeo公司联合巴黎索邦大学开发出DIP技术,让AI模型能像人类一样通过少量样本快速学习图像理解。该技术采用创新的"元学习"训练方式,无需人工标注即可显著提升模型在复杂场景下的分割性能,训练时间仅需9小时,在多个数据集上表现优异,为自动驾驶、医疗影像等领域应用提供了新可能。
YouTube为Premium会员推出AI生成的搜索轮播功能,可在购物和地点查询时显示相关视频序列。同时,此前仅限Premium用户的AI对话助手开始向美国普通用户开放,用户可通过"询问"按钮获得视频摘要和内容问答服务。该AI工具基于YouTube平台和网络信息运行,但准确性仍待观察。
微软等机构联合推出的RealPlay系统首次实现了用游戏控制指令生成现实视频的突破。该系统仅使用赛车游戏数据训练,却能控制现实中的汽车、自行车和行人运动,控制成功率达90%。RealPlay支持交互式视频生成,用户可像玩游戏般逐步指导视频发展,生成质量接近真实拍摄,为AI视频生成和未来游戏引擎开发开辟了新方向。
企业级生成式AI应用低代码平台开发商Vertesia推出全新自主代理构建器,为业务用户提供AI代理开发部署方案。该平台让业务用户能够建立可自主完成目标的AI代理,具备思考、规划和执行复杂业务流程的能力。平台提供企业级安全性、可观测性和控制能力,支持智能内容处理和配置化生成AI任务,可处理PDF、电子表格等非结构化内容,适用于金融、零售、医疗等多个行业应用场景。
中科院自动化所研究团队开发出TC-Light视频重新打光技术,能够在保持原有内容完全不变的情况下改变视频光照环境。该技术采用独创的"独特视频张量"和两阶段优化策略,可将阴天场景转换为阳光效果,或为普通视频添加科幻光影,同时保持完美的时间连贯性。技术在58个长视频测试中表现优异,为影视制作、AI训练等领域提供了高效解决方案。
谷歌宣布其人工智能助手Gemini现已具备自动填充电子表格空白单元格的功能。这项新功能将帮助用户更高效地处理数据表格,通过智能分析现有数据模式,自动推断并填入缺失信息,大幅提升办公效率和数据处理准确性。
SCB 10X团队开发了FinCoT方法,通过将金融专家推理流程嵌入AI提示中,显著提升了大语言模型在金融任务上的表现。该方法在CFA考试题目上将准确率从63.2%提升至80.5%,同时将输出长度减少8倍,为AI在专业金融领域的应用提供了新思路。
YouTube宣布推出两项AI功能:AI驱动的搜索工具和对话式AI助手。新搜索工具采用轮播形式,可根据用户搜索推荐相关视频片段和描述,目前仅Premium会员可测试。对话式AI工具此前仅向美国Android端Premium用户开放,现将扩展至部分非付费用户,用户可通过视频底部的Ask图标询问视频相关问题并获得内容推荐,无需中断播放。该工具将在未来几天内上线。
密歇根大学研究团队首次破解AI编程语言选择机制,开发出G-ACT智能控制系统。该技术能精确引导AI选择C++等高性能语言,解决科学计算中AI语言偏好不当问题。实验显示控制准确率提升15%,为构建可靠AI智能体奠定基础。这项发表于2025年6月的研究标志着从"训练AI"向"控制AI"的重要转变。
微软将在今年夏季晚些时候推出Windows恢复力计划,著名的Windows蓝屏死机将被新的黑屏替代。这一变化是微软对2024年7月CrowdStrike故障事件的回应,该事件导致约850万台Windows设备瘫痪。作为Windows恢复力计划的一部分,微软正在重新设计Windows代码,让安全软件在内核外运行,以提高系统稳定性和恢复能力,减少因第三方安全软件问题导致的系统崩溃。
Hugging Face推出3D Arena平台,通过123,243次用户投票建立首个大规模3D模型人类偏好评估体系。研究发现用户更偏爱视觉冲击力强的高斯溅射模型和带纹理模型,揭示了审美直觉与技术实用性间的差异,为AI开发提供重要参考。