Differential Privacy 是一个差异隐私库。该项目包含了 ε-差异隐私算法的 C++ 库,可用于生成包含私有或敏感信息的数字数据集的聚合统计信息。此外还提供了一个随机测试器来检查算法的正确性。
差异 - 隐私数据分析是一种原则性方法,它使组织能够从大多数数据中学习,同时确保这些结果不允许被区分或重新识别任何个人的数据。一方面是获得数据中的价值,另一方面是保证强大的数据安全性。而所谓的差异化,举个例子,如果你是一名健康研究员,可能希望比较患者在不同医院入院的平均时间,这样可以确定是否存在护理差异。
此开源版本目前提供了以下主要特性:
- 统计功能:此版本支持最常见的数据科学操作。开发人员可以使用该库计算总和、平均值、中位数和百分位数等。
- 严格的测试:除了广泛的测试套件,还包括一个可扩展的“随机差异隐私模型检查器库”,以帮助避免错误。
- 模块化:以库的形式存在,可以扩展到其它功能,如附加机制、聚合功能或隐私预算管理。