最新文章第2页

2025-12-18

# 思科自研AI模型正式应用于产品，首先赋能身份安全服务

思科宣布其自主开发的AI模型已准备就绪，开始为公司产品提供支持。该模型名为"Foundation-Sec-1.1-8B-Instruct"，是基于Meta Llama-3.1-8B架构的80亿参数指令调优模型，专门针对网络安全应用进行优化。首个应用场景是Duo身份智能服务，通过分析用户登录行为、地理位置和设备使用情况，识别传统访问控制容易遗漏的异常模式，并生成每周安全摘要报告，帮助管理员更好地进行安全决策。

人工智能

云计算基础设施

电力供应策略

2025-12-18

超大规模云厂商在2025年是解决了电力问题还是重新思考了问题？

2025年，GPU短缺、电网连接延迟及AI计算需求激增使电力成为云计算发展的限制因素。超大规模云厂商加速建设的同时重写了能源、网络和风险策略。预计到2030年，超大规模云厂商将控制全球60%的数据中心容量。AI工厂园区规模达吉瓦级，机架密度超200千瓦，电力供应成为首要瓶颈。云巨头通过大规模太阳能采购、次级市场建设和海底光缆投资来应对。电力可用性成为塑造所有决策的核心摩擦点。

人工智能

开源模型

混合架构

2025-12-18

# 英伟达成为唯一能免费提供AI模型的厂商

英伟达凭借其利润丰厚的硬件业务，成为唯一能够免费提供AI模型的公司。在OpenAI、谷歌等竞争对手纷纷转向闭源模型之际，英伟达加大了对开源Nemotron模型的投入。最新发布的Nemotron 3采用混合Mamba-Transformer架构和专家混合模型，推出Nano、Super和Ultra三个版本，参数规模从30亿到500亿不等，在推理速度和准确性上均有显著提升，展现了英伟达从芯片到软件栈的全栈整合战略。

人工智能

语音智能体

自动化质检

2025-12-18

Retell AI推出自动化质检系统，解决语音智能体人工审核瓶颈

AI语音平台Retell AI发布质检解决方案Retell Assure，可监控通话、识别问题并减少人工抽检需求。该系统使用多模型分析每通电话的延迟、中断、幻觉和客户情绪等指标，自动标记故障并提供改进建议。目前企业仍依赖人工审核AI表现，难以应对大规模通话量。Retell认为多数AI故障源于配置不当而非模型限制，其质检系统可形成持续训练循环。加拿大电动汽车充电公司Switch Energy使用该平台后，月处理8000通电话的成本降低50%，响应时间从数分钟缩短至5秒。

人工智能

生物医学计算

多模态基础模型

2025-12-18

# 法国生物科技公司发布全球首个生物学通用AI模型

法国AI初创公司Bioptomus推出新一代临床生物AI模型H-Optimus-1和全球首个通用多模态生物医学研究基础模型M-Optimus。H-Optimus-1在组织分析领域取得突破，可辅助疾病识别。M-Optimus整合全球最大专有数据集，涵盖数百万患者、50多种器官类型数据，能够创建数字孪生体预测疾病进展和治疗反应，加速药物设计并大幅降低临床试验成本和时间。该模型现已在AWS SageMaker平台开放使用。

高带宽内存

封装技术

引脚数量优化

2025-12-18

# JEDEC开发减少引脚数的HBM4标准以提升容量

JEDEC固态技术协会正在开发标准封装高带宽内存SPHBM4标准，通过减少引脚数量实现更高内存容量。SPHBM4采用512个引脚，仅为HBM4的四分之一，但通过4:1串行化和更高频率运行，可提供与HBM4相同的总吞吐量。更少的引脚允许更宽间距，支持成本更低的有机基板连接。这使得内存堆栈可以距离GPU更远，从而增加每个GPU的内存堆栈数量，提升整体容量。三星、美光和SK海力士等HBM供应商需支持该标准才能实现商用。

光学存储

直接玻璃写入技术

托管服务模式

2025-12-18

# Ewigbyte光学归档存储技术及战略解析

新兴企业Ewigbyte采用直接在未涂层玻璃上写入数据的光学存储技术，数据物理嵌入基板可保存数百至数千年。与Cerabyte不同，该公司不出售硬件设备，而是提供托管服务模式。其首代玻璃介质容量约10GB，读写速度目标为每头500MB/s，支持8个并行头。公司计划明年年中展示首个运营机架，2026年9月实现TB级写入演示。该技术无需能耗和冷却，适合冷数据长期存储。

人工智能

可穿戴设备

智能终端创新

2025-12-18

2025年：可穿戴设备全面转向AI技术

2025年成为可穿戴技术的转折之年。过去十年，该领域主要聚焦健康健身，但今年科技公司纷纷将可穿戴设备定位为AI载体。智能眼镜被重新命名为"AI眼镜"，Meta、谷歌等巨头强调AI交互才是核心卖点。市场还涌现出AI吊坠、AI别针等随身监听设备。三星、苹果、Garmin等品牌也在智能手表中加入AI功能。业界认为可穿戴设备是唯一能保证全天候贴身存在的计算设备，成为AI助手的理想载体。

人工智能

云计算

数据中心租赁

2025-12-18

# Oracle领衔科技巨头5000亿美元AI数据中心租赁狂潮

甲骨文、微软、Meta等云计算巨头未来将投入5000亿美元租赁数据中心，反映行业对人工智能的巨额押注。甲骨文承诺最高达2480亿美元，其中仅去年11月单季就签约1500亿美元,主要用于支撑OpenAI模型训练部署。与亚马逊、微软相比，甲骨文云业务规模较小但单一客户风险集中。Meta承诺租赁支出达580亿美元，是一年前的三倍。这些租赁成本独立于资本支出统计，六家公司过去四季度资本开支达3720亿美元。

西云数据

2025-12-17

新农人：西云数据如何绘制智慧农牧“全景图”

通过提供强大的云计算、大数据和人工智能技术，西云数据正致力于打造一幅 “智慧农牧全景图”，构建面向未来的“新质生产力”，助力农牧企业实现从“降本增效”到“全链智能”的根本性飞跃。

2025-12-17

据说算力高达1000 TOPS，华硕Ascent GX10深度评测——开箱

当超级计算机被压缩进一个比书本还小的盒子里,这画面有多炸裂?想象一下,你桌面上摆着的不是什么花瓶摆件,而是一台能跑200B参数AI推理的"超算怪兽"——这就是我们今天要聊的主角:华硕Ascent GX10。

人工智能

图像生成

模型优化

2025-12-17

Adobe与UCLA联手突破AI模型速度瓶颈：让图像生成快一倍的"稀疏化魔法"

Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法，成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域，使用特殊"寄存器令牌"管理其余部分，在文本到图像生成、图像编辑和数学推理等任务中实现显著加速，同时完全保持了输出质量。

不用再训练AI模型，香港科技大学团队发明"智能管家"，让AI一眼就知道该抓哪里用哪里

人工智能

计算机视觉

零样本学习

2025-12-17

不用再训练AI模型，香港科技大学团队发明"智能管家"，让AI一眼就知道该抓哪里用哪里

香港科技大学团队开发出A4-Agent智能系统，无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程，在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路，使其能够像人类一样举一反三地处理未见过的新物品和任务。

韩国KAIST让SVG动画脱胎换骨：AI如何破解矢量图形的"语义迷宫"让静态图标活起来

人工智能

计算机视觉

矢量动画技术

2025-12-17

韩国KAIST让SVG动画脱胎换骨：AI如何破解矢量图形的"语义迷宫"让静态图标活起来

韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理，解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画，生成的动画文件比传统视频小54倍，在多项评估中超越顶级竞争对手，为数字创意产业带来重大突破。

人工智能

参数效率

新型算法

2025-12-17

华为诺亚方舟实验室新突破：不加内存也能让AI变聪明的神奇方法

华为诺亚方舟实验室提出VersatileFFN创新架构，通过模仿人类双重思维模式，设计了宽度和深度两条并行通道，在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算，实现了参数重用和自适应计算分配，为解决AI模型内存成本高、部署难的问题提供了全新思路。

强化学习

多代理协作

2025-12-17

阿里巴巴重新定义推荐系统：RecGPT-V2如何让AI读懂你的心思

阿里巴巴RecGPT团队开发的RecGPT-V2系统通过多代理协作、动态解释生成、约束强化学习等创新技术，将推荐系统从简单的行为匹配升级为深度意图理解。在淘宝平台测试中实现了点击率提升2.98%、交易额增长2.19%等显著改进，同时GPU消耗降低60%，代表了推荐系统向智能化转型的重大突破。

人工智能

图像生成

统一架构

2025-12-17

北大团队突破AI绘画新难题：让机器像人一样精准识别和创作多主体图像

北京大学团队开发了名为Scone的AI绘画新技术，解决了现有AI在复杂图像中无法准确识别指定对象的问题。该系统通过"理解桥梁"策略，让AI能像人类一样精准理解用户指令，在包含多个候选对象的图像中准确识别目标并生成相应画面。团队还创建了SconeEval评测基准，Scone在测试中表现优异，在开源模型中排名第一。

2025-12-17

苹果发现：只需一个注意力层，就能让AI图像生成既快又好

人工智能

游戏开发

原型应用

2025-12-17

YouTube推出基于Gemini 3的创作者游戏制作工具

YouTube Gaming宣布推出Playables Builder开放测试版，允许特定创作者使用基于Gemini 3的原型网页应用制作小型游戏，无需编程知识。该工具类似于Google Labs的Disco和GenTabs项目，通过自然语言输入生成交互式内容。尽管AI助手能帮助用户无需技术知识即可创作，但优秀游戏需要技巧、迭代和专业知识才能打造真正有趣的体验。

人工智能

混合架构

开源模型

2025-12-17

英伟达是唯一能负担免费提供AI模型的厂商

英伟达凭借其庞大的硬件业务利润，成为唯一能够承担免费提供AI模型成本的公司。随着OpenAI、Anthropic等专有模型制造商竞争加剧，Meta考虑转向封闭模型，英伟达却加倍投入开源Nemotron模型。公司可以成本价获得任何规模的AI集群进行训练，其AI Enterprise软件栈年费仅4500美元。新发布的Nemotron 3采用混合专家架构，结合Mamba-Transformer技术，显著提升推理效率和内存使用率。

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: