隐私保护模型 关键字列表
OpenAI推出隐私过滤器:本地运行防止个人信息上传云端

OpenAI推出隐私过滤器:本地运行防止个人信息上传云端

OpenAI推出Privacy Filter,这是一款双向令牌分类模型,专为检测和脱敏个人身份信息(PII)而设计。该模型支持单次扫描长文本,可在浏览器或笔记本电脑本地运行,无需将敏感数据上传云端。模型参数总量15亿,活跃参数仅5000万,轻量高效。支持识别姓名、地址、邮件、电话等8类信息,上下文感知能力强于传统正则或NLP工具,在PII-Masking-300k基准测试中F1得分达96%。现已在Hugging Face和GitHub开源。

Google发布首个隐私保护大语言模型VaultGemma

Google发布首个隐私保护大语言模型VaultGemma

谷歌研究团队推出VaultGemma,这是其首个采用差分隐私技术的大语言模型。该模型基于Gemma 2构建,拥有10亿参数,通过在训练阶段引入校准噪声来防止模型"记忆"敏感用户数据。研究团队建立了差分隐私缩放定律,平衡计算预算、隐私预算和数据预算。尽管添加差分隐私会影响准确性,但VaultGemma在性能上与同规模非私有模型相当。该模型现已在Hugging Face和Kaggle平台开放下载。