如果个人的真实身份不能从匿名数据中得到,则该数据将免除其他方法,来确保实际数据的严格保密性。
这两种技术是不同的,在GDPR面前,选择哪种技术将取决于风险的程度和数据的处理方法。
假名化是什么?
假名化(pseudonymisation)通过用一个或多个人工标识符或假名来替换数据记录中的大多数标识字段来增强私密性。一个被替换字段的集合可以有一个假名,或者每个被替换字段都可以有一个假名。
具体来说,GDPR在第3条中将假名定义为“在不使用额外信息的情况下,以一种不属于特定数据主体的方式处理个人数据”。为了给一组数据假名,“附加信息”必须单独保存,并遵循技术和组织措施,以确保不属于已确认身份或可识别的人。
数据掩蔽:匿名化还是假名化?
匿名数据和假名数据在法律上的区别在于其是否属于个人数据。假名数据仍允许某种形式的重新识别(甚至是间接和远程的识别),而匿名数据则不能重新识别。
假名技术不同于匿名技术。使用匿名,数据将被清除,以获取任何可能作为数据主体标识符的信息。假名化并不会从数据中删除所有身份信息,而是降低数据集与个人原始身份的可链接性。
GDPR鼓励假名化和匿名化。因此,这些技术应该被推广和使用。持有个人资料的数据管理者应采用其中一项技术,来降低风险。
哪些数据应该匿名?
根据定义,数据匿名技术寻求隐藏身份,从而隐藏任何性质的标识符。身份识别可以适用于任何自然人或法人,在世或去世,包括其家属和后代。包括其他直接或通过互动的相关人员。
例如:
姓氏,名字,别名
邮政地址、电话号码、邮政编码和城市
身份证:社会安全编码(如意大利的财政代码,英国的国民保险号码),银行账户信息,信用卡号码,有效钥匙,部分匿名。
有哪些方法可以匿名化数据?
有多种方法可供选择,同样,选择取决于风险的程度和数据的预期用途。
目录替换
目录替换方法包括修改集合在数据中的名称,同时保持数值之间的一致性。
打乱
打乱技术包括混合或混淆字母。这个过程有时是可逆的。
掩蔽
掩蔽技术允许用随机字符或其他数据隐藏部分数据。掩蔽的优点是能够在不操纵实际身份的情况下识别数据。
个性化的匿名化
这种方法允许用户使用自己的匿名技术。自定义匿名可以通过脚本或应用程序来实现。
模糊
数据模糊使用数据值的近似值,使其含义过时或造成个人识别的困难。
数据掩蔽与数据加密:两种化名方法的比较
与数据屏蔽不同的是,数据加密将数据转换为另一种形式,即代码,因此只有能够访问密钥或密码的人才能读取它。
数据掩蔽是一种适用范围更广的解决方案,因为它使组织能够保持客户数据的可用性。
数据掩蔽是数据假名的标准解决方案。使用掩蔽,数据可以降低识别和敏感度,这样在支持、分析、测试或外包的环境中,个人信息仍然是匿名的。(本文出自SCA安全通信联盟,转载请注明出处。)