大语言模型文章列表第1页-至顶网频道 - 至顶网

/

大语言模型关键字列表

亚马逊AI负责人离职，引发领导层重大调整

人工智能

大语言模型

组织重构

2025-12-29

亚马逊AI负责人离职，引发领导层重大调整

亚马逊CEO贾西宣布，AWS实用计算产品高级副总裁彼得·德桑蒂斯将领导新的AI组织，专注于Nova模型发展、定制芯片开发和量子计算。作为领导层变动的一部分，德桑蒂斯将接管人工通用智能团队，原负责人罗希特·普拉萨德将于2025年底离职。新组织还包括皮特·阿贝尔领导前沿模型研究团队。

AMD Strix Halo与Nvidia DGX Spark：哪款AI工作站更胜一筹？

人工智能

大语言模型

AI工作站

2025-12-26

AMD Strix Halo与Nvidia DGX Spark：哪款AI工作站更胜一筹？

两款AI工作站系统对比测试显示，英伟达DGX Spark在计算性能上领先AMD Strix Halo系统2-3倍，特别是在模型微调和图像生成方面表现突出。但AMD系统在单用户LLM推理场景下表现相当，且价格更具优势。AMD平台软件兼容性仍有不足，需要更多配置工作，而英伟达CUDA生态更加成熟。对于纯AI应用场景，DGX Spark更适合；若需要兼顾日常办公和游戏，AMD平台性价比更高。

AI编程智能体工作原理及使用注意事项

人工智能

大语言模型

模式匹配

2025-12-25

AI编程智能体工作原理及使用注意事项

OpenAI、Anthropic和Google的AI代码助手现在能够在人工监督下连续工作数小时，编写完整应用、运行测试并修复错误。但这些工具并非万能，可能会让软件项目变得复杂。AI代码助手的核心是大语言模型，通过多个LLM协作完成任务。由于存在上下文限制和"注意力预算"问题，系统采用上下文压缩和多代理架构来应对。使用时需要良好的软件开发实践，避免"氛围编程"，确保代码质量和安全性。研究显示经验丰富的开发者使用AI工具可能反而效率降低。

MiniMax发布M2.1大语言模型，大幅提升多语言编程能力

人工智能

大语言模型

编程能力优化

2025-12-24

MiniMax发布M2.1大语言模型，大幅提升多语言编程能力

中国AI初创公司MiniMax发布M2.1模型，在多种编程语言和办公场景中显著提升了复杂任务处理和智能体能力。该模型在Rust、Java、Golang、C++等多种编程语言方面表现出色，在Web、Android和iOS界面开发的美学设计能力大幅提升。M2.1不仅专注于代码执行正确性，还能遵循复杂指导，在VIBE基准测试中平均得分88.6分。

ChatGPT全指南：关于这款AI驱动聊天机器人的一切

人工智能

大语言模型

产品更新

2025-12-24

ChatGPT全指南：关于这款AI驱动聊天机器人的一切

ChatGPT自2022年11月发布以来已成为全球最受欢迎的AI聊天机器人，拥有3亿周活跃用户。文章详细介绍了ChatGPT的最新功能更新，包括语音模式、图像生成、代码编写等核心能力，以及OpenAI在企业级应用、安全防护和模型优化方面的持续改进。同时涵盖了定价方案、使用指南和常见问题解答。

OpenAI 获百亿美元融资与AI投资热潮持续升温

人工智能

大语言模型

投资融资

2025-12-22

OpenAI 获百亿美元融资与AI投资热潮持续升温

OpenAI可能以7500亿美元估值从亚马逊等投资者处筹集高达1000亿美元资金，其中包括亚马逊的100亿美元投资。Databricks正以1340亿美元估值进行40亿美元的L轮融资。与此同时，甲骨文因合作伙伴拒绝为其100亿美元密歇根数据中心项目提供资金而令股市震惊。ServiceNow传闻以70亿美元收购网络安全公司Armis，但投资者对此表示担忧。

思科自研AI模型正式应用于产品，首先赋能身份安全服务

网络安全

大语言模型

安全智能化

2025-12-18

思科自研AI模型正式应用于产品，首先赋能身份安全服务

思科宣布其自主开发的AI模型已准备就绪，开始为公司产品提供支持。该模型名为"Foundation-Sec-1.1-8B-Instruct"，是基于Meta Llama-3.1-8B架构的80亿参数指令调优模型，专门针对网络安全应用进行优化。首个应用场景是Duo身份智能服务，通过分析用户登录行为、地理位置和设备使用情况，识别传统访问控制容易遗漏的异常模式，并生成每周安全摘要报告，帮助管理员更好地进行安全决策。

英伟达推出开源权重模型填补美国AI市场空白

人工智能

大语言模型

开源权重模型

2025-12-17

英伟达推出开源权重模型填补美国AI市场空白

英伟达发布三款全新开源权重模型Nemotron，包括Nano、Super和Ultra三个版本，参数量分别为300亿、1000亿和5000亿。这些模型采用混合潜在专家架构，结合Mamba-2和Transformer技术，支持百万token上下文窗口，可在企业硬件上高效运行。英伟达还将开源训练数据和强化学习环境，帮助企业定制化模型。

奥运级别的努力：首席信息官为2026年AI颠覆做准备

人工智能

大语言模型

企业文化

2025-12-12

奥运级别的努力：首席信息官为2026年AI颠覆做准备

AI颠覆预计将在2026年持续，推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择，AI在内部流程优化和外部产品开发中的应用，以及小型模型在日常应用中的潜力。专家建议，企业应将AI建设融入企业文化，以创新而非成本节约为驱动力。

OpenAI发布GPT-5.2挑战谷歌和Anthropic

人工智能

大语言模型

模型优化

2025-12-12

OpenAI发布GPT-5.2挑战谷歌和Anthropic

OpenAI推出GPT-5.2模型，专为专业工作场景优化。新模型在创建电子表格、制作演示文稿、编写代码等方面表现更佳。GPT-5.2 Thinking版本在多项基准测试中超越前代产品，数学问题获得满分，事实性回答错误率降低30%。该发布被视为OpenAI对谷歌Gemini 3 Pro的"红色警报"回应，旨在重新夺回AI领域领先地位。

Anthropic与埃森哲达成大规模AI合作协议

人工智能

大语言模型

企业合作

2025-12-10

Anthropic与埃森哲达成大规模AI合作协议

Anthropic宣布与埃森哲达成全面合作，后者将广泛采用Claude系列大语言模型。埃森哲将成立包含约3万名专业人员的Anthropic业务部门，重点推广Claude Code编程助手的使用。双方将共同开发面向高度监管行业如金融服务和生命科学的AI解决方案，并通过创新中心为财富全球2000强企业提供AI测试环境，这标志着Anthropic迄今为止最大规模的部署合作。

Anthropic基于新AI工具开展大规模调查研究

人工智能

大语言模型

半结构化调查

2025-12-09

Anthropic基于新AI工具开展大规模调查研究

Anthropic公司推出名为Clio的创新调研工具，对1200多名专业人士进行深度访谈，探索用户如何使用大语言模型及其感受。调研发现，用户对AI持积极态度，主要将Claude用于编程开发、教育和商业策略等工作任务。计算机和数学专业人员占受访者37.2%。尽管整体乐观，但仍存在AI使用偏见，部分用户担心被视为懒惰或获得不当优势。

OpenAI计划下周发布GPT-5.2应对谷歌竞争

人工智能

大语言模型

模型竞争

2025-12-08

OpenAI计划下周发布GPT-5.2应对谷歌竞争

OpenAI首席执行官山姆·阿尔特曼本周宣布进入"红色警戒"状态，要求员工快速响应来自谷歌和Anthropic的竞争压力。据知情人士透露，OpenAI计划下周发布GPT-5.2更新以应对谷歌Gemini 3的挑战。原计划12月下旬发布的GPT-5.2现已提前至12月9日发布，旨在缩小与谷歌上月发布的领先模型Gemini 3之间的差距。

Anthropic与Snowflake签署2亿美元合作协议，将大语言模型引入企业客户

人工智能

大语言模型

企业合作

2025-12-05

Anthropic与Snowflake签署2亿美元合作协议，将大语言模型引入企业客户

AI研究公司Anthropic宣布与云数据公司Snowflake扩大合作伙伴关系，签署价值2亿美元的多年AI协议。此次合作将把Anthropic的大语言模型引入Snowflake平台，服务其庞大客户群。Claude Sonnet 4.5将为Snowflake Intelligence企业AI服务提供支持，客户可使用Claude模型进行多模态数据分析并构建定制AI代理。

Anthropic CEO评估AI行业泡沫风险和竞争对手激进策略

人工智能

大语言模型

风险管理

2025-12-05

Anthropic CEO评估AI行业泡沫风险和竞争对手激进策略

Anthropic CEO达里奥·阿莫代在纽约时报峰会上表示，AI行业存在复杂的泡沫风险情况。他看好AI技术潜力，但警告某些公司可能出现"时机错误"或经济回报方面的"坏事"。阿莫代指出，AI经济价值增长时机的不确定性以及数据中心建设滞后是主要问题。他批评部分竞争对手采取"YOLO"式冒险策略，暗指OpenAI。Anthropic收入三年增长10倍，但他强调要保守规划，避免过度投资风险。

AI新加坡联手阿里云推出东南亚大语言模型Sea-Lion v4

人工智能

大语言模型

区域优化

2025-11-26

AI新加坡联手阿里云推出东南亚大语言模型Sea-Lion v4

新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4，专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集，在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言，能在32GB内存的消费级笔记本上运行，采用字节对编码技术更好处理非拉丁文字，并具备3.2万词元上下文长度，可执行文档级推理和摘要任务。

谷歌发布Gemini 3，新增编码应用并创基准测试纪录

人工智能

大语言模型

基准测试突破

2025-11-19

谷歌发布Gemini 3，新增编码应用并创基准测试纪录

谷歌发布最新Gemini 3基础模型，在推理能力方面实现重大突破。该模型在人类最终考试基准测试中创下37.4分新纪录，超越此前GPT-5 Pro的31.64分。同时推出Gemini驱动的编程界面Google Antigravity，提供多面板智能编程体验，类似Warp或Cursor 2.0等智能IDE。目前Gemini应用月活用户超6.5亿，已有1300万软件开发者使用该模型。

Verizon和Collectors如何运用AI：数十亿美元计划和千个模型

人工智能

大语言模型

企业应用

2025-11-18

Verizon和Collectors如何运用AI：数十亿美元计划和千个模型

两家公司在OverdriveAI峰会上分享了AI应用经验。Verizon拥有超过1000个AI模型，用于预测客户呼叫原因和提供个性化服务，将AI推向边缘计算。Collectors则利用AI识别收藏品真伪，将每张卡片的鉴定时间从7分钟缩短至7秒，估值从8.5亿美元增长至43亿美元。

OpenAI发布更智能温暖的GPT-5.1版本

人工智能

大语言模型

模型优化

2025-11-13

OpenAI发布更智能温暖的GPT-5.1版本

OpenAI正式推出GPT-5.1，主打更温暖自然的对话风格和增强的智能水平。新版本包含即时模式和思考模式两种变体，其中思考模式在简单任务上速度更快，复杂任务上更持久。GPT-5.1默认采用更对话化的语调，并提供友好、高效、专业等多种个性化选项。模型在遵循特定指令方面也有显著改进。该更新首先面向付费用户推出，随后扩展至免费用户。

了解AI编程个性是进行氛围编程的最佳方式

人工智能

代码生成

大语言模型

2025-10-23

了解AI编程个性是进行氛围编程的最佳方式

要成功进行"氛围编程"，关键是了解所使用的生成式AI或大语言模型的编程个性。不同AI模型生成的代码风格迥异，有的精准简洁，有的冗长混乱。研究显示，当前主流LLM在代码生成方面各有特点，但普遍存在安全漏洞和工程规范不足等问题。用户需要认识到AI生成的代码往往不完整、包含错误，仍需人工审查和完善。

1
2
3
4
5
...
9
10

白皮书

更多

数字化转型方略

更多

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证