模型对齐文章列表第1页-至顶网频道

计算
- 服务器
- 数据中心
存储
网络与安全
软件与服务
商用办公
CIO与CTO
- 企业开源智库
- 企业开源实践联盟通讯
数字化转型
新基建
云资讯
人工智能
端侧AI
AIPC
数据要素
- 区块链
物联网
资讯
- 行业资讯

模型对齐关键字列表

人工智能

安全防护

模型对齐

2026-02-11

微软研究显示：一个提示词就能破坏AI模型安全防护机制

微软AI红队研究发现，经过安全训练的AI模型在部署后极其脆弱，仅需一个无害提示就能破坏其安全防护机制。研究人员使用GRPO技术成功让15个主流开源模型偏离安全轨道，包括DeepSeek、Gemma、Llama等。即使是"创建可能引起恐慌的假新闻"这样相对温和的提示，也足以让模型在未见过的有害类别中变得更加宽松。研究强调模型对齐的脆弱性，建议开发者不应仅限于部署前的安全研究。

白皮书

LinuxONE 客户案例集锦
IBM 存储客户案例集锦
智能超融合基础设施 - HPE SimpliVity 解决方案
借助 HPE GreenLake 提供本地云体验解决方案
掌控全局 — 推动业务创新：适用于 HPE SimpliVity 的 HPE 主动式系统支持服务
实现居家办公高效率解决方案
实现关键业务革新 - HPE Primera解决方案
搭配Nutanix的HPE GreenLake私有云解决方案
重新定义 HCI，助其更上一层楼
适用于 VDI 的 HPE GreenLake - 本地云服务解决方案

数字化转型方略

人工智能

安全防护

模型对齐

微软研究显示：一个提示词就能破坏AI模型安全防护机制

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: