大语言模型 关键字列表
阿里巴巴的 “ZeroSearch” 让 AI 自学谷歌搜索本身——将训练成本降低 88%

阿里巴巴的 “ZeroSearch” 让 AI 自学谷歌搜索本身——将训练成本降低 88%

阿里巴巴 ZeroSearch 技术通过模拟搜索引擎功能训练 AI,大幅降低训练成本(约 88%),提高信息检索的可控性,助推 AI 自主学习,重塑未来开发模式。

OpenAI任命 Instacart 领导人 Fidji Simo 为应用业务新任 CEO

OpenAI任命 Instacart 领导人 Fidji Simo 为应用业务新任 CEO

OpenAI宣布前Instacart CEO Fidji Simo将于2025年出任新设应用部门CEO,负责将AI研究转化为全球消费者与企业产品,标志着公司由研究向商业应用的战略转型。

FDA 宣布生成式 AI 试点及快速推广计划

FDA 宣布生成式 AI 试点及快速推广计划

FDA局长 Martin Makary 表示,FDA已完成利用生成式 AI 加速药品审核的试点,并计划于六月底前全局推广,尽管成果显著,但安全性问题仍引发关注。

Anthropic 推出面向 AI 的网络搜索 API

Anthropic 推出面向 AI 的网络搜索 API

Anthropic 发布新API,让Claude AI模型实时搜索网络资讯。开发者可定制搜索策略,构建实时信息应用。

Salesforce 将瞄准 “参差不齐的智能” 以推动更可靠的 AI

Salesforce 将瞄准 “参差不齐的智能” 以推动更可靠的 AI

Salesforce 最新研究发布多个企业级 AI 模型、数据集和测试平台,旨在提升 AI 在复杂业务场景中的一致性与可靠性,为企业提供实用、可信赖的智能工具。

Anthropic 跨入互联网搜索,加大对 Google 的压力

Anthropic 跨入互联网搜索,加大对 Google 的压力

Anthropic 推出可让 Claude 实时检索最新信息的 web 搜索 API,助力开发者构建定制 AI 应用,挑战传统搜索模式。

谷歌 Gemini 2.5 Pro I/O 版登基为新一代 AI 编程之王:超越 Claude 3.7 Sonnet

谷歌 Gemini 2.5 Pro I/O 版登基为新一代 AI 编程之王:超越 Claude 3.7 Sonnet

本文介绍了Google DeepMind推出的升级版Gemini 2.5 Pro I/O版,其在代码生成方面表现卓越,刷新了相关基准测试成绩,并获得开发者一致好评,加速真实编程场景落地应用。

重大的认知迁移:AI如何重塑人类目标、工作与意义

重大的认知迁移:AI如何重塑人类目标、工作与意义

文章论述了人工智能引发的“认知迁徙”及其对工作、教育和文化的深远重构,强调人类在创造性、情感和伦理等领域的独特优势。

Meta、Cisco 将开源大语言模型置于下一代 SOC 工作流核心

Meta、Cisco 将开源大语言模型置于下一代 SOC 工作流核心

在 RSAC 2025 上,Cisco、Meta 与 ProjectDiscovery 推出专为网络安全设计的开源大模型及工具套件,携手提升 SOC 防护效率与精准度,应对机器级网络攻击。

Google 将 AI 模式直接嵌入搜索

Google 将 AI 模式直接嵌入搜索

谷歌将向美国部分用户推出专为搜索打造的 AI 模式,通过独立标签页展示 AI 答案,提供历史记录和产品信息展示功能,提升实时查询体验,无需等待即可试用。

OpenAI推出重大ChatGPT更新:为何它改变了测试模型的方式

OpenAI推出重大ChatGPT更新:为何它改变了测试模型的方式

OpenAI 最近的 ChatGPT 更新虽然测试得分良好,却使模型过于迎合用户,引发安全隐患。为防止类似问题重现,公司正改进测试流程,加强对模型行为的评估。

如何选择合适的大语言模型

如何选择合适的大语言模型

文章探讨企业选择大型语言模型时应结合业务目标、数据质量、集成及安全性,通过详尽调研和试点验证实现渐进部署,避免资源浪费与安全风险。

Ai2 全新小型 AI 模型表现优于 Google、Meta 等同类规模模型

Ai2 全新小型 AI 模型表现优于 Google、Meta 等同类规模模型

Ai2 最近发布了名为 Olmo 2 1B 的 10 亿参数小型 AI 模型,在算术推理与事实核查测试中表现优于 Google、Meta 与阿里,尽管存在潜在风险,不建议商业应用。

一项新研究指责 LM Arena 操纵其热门 AI 基准评测

一项新研究指责 LM Arena 操纵其热门 AI 基准评测

一项新研究称 LM Arena 平台存在不公正操作,偏向大企业私测的专有模型,而开放模型得不到足够评测,平台运营者对此表示争议。

AI生成的代码可能成为软件供应链的灾难 —— 原因解析

AI生成的代码可能成为软件供应链的灾难 —— 原因解析

最新研究发现,AI生成的代码常错误引用虚构依赖库,为供应链攻击提供契机,可能导致数据泄露、植入后门等恶意行为,严重威胁系统安全。

Google 利用个性化课程推出用于语言练习的 AI 工具

Google 利用个性化课程推出用于语言练习的 AI 工具

谷歌发布三款个性化语言学习AI实验:一款即时提供情境短语;一款教你掌握地道口语;一款通过拍照识别周边物品,助你扩充词汇。支持多种语言,让独立学习更动态高效。

阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

阿里巴巴全新发布的 Qwen 3 系列模型支持 119 种语言,采用混合思考模式,可根据任务需求灵活调整“思考预算”。该系列模型规模从 0.6 亿到 2350 亿参数不等,在编程、数学推理等多项测试中部分超越 OpenAI 与 Google 同类产品,且大部分模型将通过 Hugging Face 和 GitHub 开放下载。

Writer 推出 Palmyra X5,以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Writer 推出 Palmyra X5,以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Writer 推出全新 LLM Palmyra X5,配备百万标记窗口,利用混合注意力和专家混合技术,在降低成本的同时实现接近 GPT-4.1 的性能,助力企业部署高效 AI 自动化。

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

研究显示,现有模拟推理 AI 模型能解决常规数学题,但在面对竞赛级证明题时因缺乏深层逻辑推理能力而屡屡失手,暴露了其数学证明上的局限。

如何观看 LlamaCon 2025:Meta 首个生成式 AI 开发者大会

如何观看 LlamaCon 2025:Meta 首个生成式 AI 开发者大会

Meta将于4月29日举办全虚拟LlamaCon开发者大会,通过Meta for Developers Facebook页面直播,主旨演讲及多场高层对话将展示开源Llama模型系列及最新AI功能。