众力资讯网

数据处理中常常需要手动检查和脱敏个人信息,PII检测工具繁多、速度慢、部署复杂,

数据处理中常常需要手动检查和脱敏个人信息,PII检测工具繁多、速度慢、部署复杂,还得担心隐私泄露和合规问题。

OpenAI Privacy Filter 将PII检测与脱敏完美整合,提供高效、本地运行的隐私保护解决方案。

不仅能双向识别8类隐私标签(姓名、邮箱、电话、地址、日期、URL、账号、密钥),还支持长上下文128k token、浏览器/本地运行、精确召回调节,甚至能针对自定义数据微调优化。

GitHub:github.com/openai/privacy-filter

主要功能:

- 双向token分类,支持8类PII(private_person/email/phone等)实时检测与masking;- 高吞吐量推理,一次前向pass处理整个序列,无需分块,支持128k长上下文;- 本地CLI工具,一键redact文件/管道,支持GPU/CPU,浏览器直跑;- 可微调训练,适配企业特定隐私策略和数据分布;- 多种运行模式:redact、eval、train,输出结构化JSON,Apache 2.0许可商用;- 约束Viterbi解码,确保span边界连贯,支持precision/recall调节。

支持Web浏览器、Python本地部署,pip install后即用,适合开发团队、数据工程师和隐私合规场景。

AI隐私保护数据脱敏 OpenAI