英国政府人工智能安全研究所发布前沿AI趋势报告,基于两年的网络安全及科学研究。报告显示,AI模型安全防护显著提升,破解安全规则所需时间从数分钟延长至数小时。AI在网络安全学徒级任务的成功率从两年前不足10%提升至50%,首次有AI完成专家级网络任务。报告旨在为技术决策者提供基于证据而非猜测的清晰数据,支持AI负责任发展,同时确保安全可信。
Hugging Face推出开源工具Yourbench,允许企业创建自定义基准来评估AI模型在其内部数据上的表现。这一工具通过复制大规模多任务语言理解基准的子集,以极低成本实现了对模型性能的精确评估。Yourbench的出现为企业提供了更贴合实际需求的AI模型评估方法,有望改善模型评估的方式。
近期AI模型层出不穷,从谷歌等科技巨头到OpenAI、Anthropic等初创公司,都在不断推出新模型。本文梳理了2024年以来发布的最先进AI模型,介绍它们的功能特点和使用方法,帮助读者了解最新AI发展动态,选择适合的模型使用。文章将持续更新,跟踪最新模型发布情况。