Top
首页 > 正文

多方中介计算:一种新的隐私计算方法

发布时间:2021-09-16 20:39        来源:赛迪网        作者:

数据是土地、劳动力、资本和技术之外的第五大生产要素,是重要的战略资源,被称为数字经济的“石油”。如何促进数据资源的充分流动与共享利用,又同时保障数据安全是当前面临的重大课题。随着《个人信息保护法》的出台,个人信息权益保护受到高度重视,隐私保护问题更为突出。

根据我国《个人信息保护法》的规定,处理个人信息除少数法律规定的情况外,应取得个人的授权同意。特别是,个人信息的处理目的、处理方式和处理的个人信息种类发生变更的,应当重新取得个人同意;个人信息处理者向其他个人信息处理者提供其处理的个人信息的,应当向个人告知接收方的名称或者姓名、联系方式、处理目的、处理方式和个人信息的种类,并取得个人的单独同意。实际上,平台企业、政府机关等个人信息收集、存储者控制着大量个人信息数据,其具有极为广泛、重要的应用价值。如果这些信息数据的开发利用均需得到个人的同意或者重新授权,甚至是单独同意,显然是十分困难且成本很高的。并且,在大数据应用中,分析事物的发展变化趋势和规律,找出其相关性非常重要,这种不针对个人的群体性分析计算,不会伤及信息主体。如果一律适用二次授权同意的严苛规则,无疑将使大量的信息数据开发利用受到限制。同时,信息数据经常会改变用途或发现其新的应用价值甚至更大的应用价值,也经常会有初始信息数据处理者之外的其他人需要使用信息数据,这也是信息数据价值不断开发的重要特征。法律上虽然规定了匿名化处理后的数据不属于个人信息,但完全匿名化也意味着各数据方的数据之间无法二次关联,会大大削弱信息数据的使用价值。因此,迫切需要寻找既化解个人信息保护与开发利用矛盾,又避免合规风险的有效方法。

隐私计算(Privacy-preserving computation)是指在保护隐私的条件下对信息数据进行分析计算的一系列技术。这类技术实现了明文数据不出本地,又能在加密状态下联合运算,也就是数据“可用不可见”,从而保护了相关信息数据主体的个人隐私。目前比较流行的隐私计算算法,包括多方安全计算、联邦学习、可信执行环境等,虽然通过复杂的数学原理、密码学技术一定程度上实现了数据可用不可见、分布式计算,但计算效率低、算法不透明,且在法理上并未解决改变个人信息使用目的、向其他方提供信息数据需要重新获得个人同意的难题,所以主要应用在数据计算量小、且有强授权的金融风控、电子政务等场景。并且,一般隐私计算各种算法在设计过程中,往往采用数据方直连的模式,加之数据在密文下运算,无法为外界提供集中审计和监管的功能。

为此,我们提出了一种新的隐私计算方法,即多方中介计算,可有效破解上述难题。所谓多方中介计算(Multi-party intermediary computation, MPIC),是指多方数据在独立于数据方和用户的受监管中介计算环境内通过安全可信机制实现分析计算和匿名化结果输出的数据处理方式,是一个计算管理系统。在多方中介计算中,数据方的原始数据由其去标识化后输入中介计算环境或平台参与计算,完成计算后立即被删除,匿名化结果数据经审核后按指定路径输出。多方中介计算的关键是中介计算环境或平台,它是数据方与用户之间信息数据供需的中间桥梁,提供了一个隐私计算的安全可信监管环境。由于信息数据的计算许多情况下要进行数据关联分析,用户往往需要同时获得多个数据方提供的信息数据才能满足其计算需要,故称之为多方中介计算。当用户只需要一个数据方提供的信息数据时,数据方可将数据直接进行匿名化或去标识化处理后再交给用户进行中介计算,此种情况可视为多方中介计算的一个特例。在多方中介计算中,各数据方无法获得其他数据方提供的原始数据;用户之间亦相互独立,彼此无法获得其他用户使用的数据;同时,用户必须向平台报备其算法,平台会如实记录用户处理数据的过程,以接受数据提供方和监管部门的审查。

多方中介计算具有数据可进不可出、可用不可控、数据匿名、算法透明、安全经济、可监管等重要特点,具有重大的应用价值。其最大优势在于,所处理的数据被视同匿名化,无需个人授权同意即可使用。这是因为,在多方中介计算中为保护个人隐私,所有信息数据都对其身份标识采用SHA256哈希等单向函数加密后去标识化,因其算法具有不可逆性,故无法恢复为原始数据,从而满足了匿名化的一个要求,即不能原复;同时,由于这些去标识化信息数据被封闭在特定受监管环境或平台中,没有机会泄漏出去,也不会有新的额外信息输入而使其具有识别特定自然人的能力,客观上达到了匿名化的另一个要求,即无法识别特定自然人。总之,在多方中介计算的特定环境和规则下,被处理的数据实质上取得了“无法识别,不能复原”的匿名化效果,可视同匿名化。这样,被处理的信息数据就可以看作为经匿名化处理后的信息,不再属于个人信息,从而无需征得个人同意就可进入中介计算环境或平台参与计算。这种机制安排,突破了信息数据改变用途和交给初始信息数据处理者之外其他人使用所遭受的限制或困境,将极大地促进信息数据价值的开发利用。当然,这种无需个人授权或同意的多方中介计算,不得用于进行个人画像或个体性计算和应用,在这种情况下仍需依法获得个人同意。 

目前,经浙江省领导批准、杭钢集团发起成立的浙江省数据安全服务有限公司已经搭建了一个大数据多方中介计算平台,正在尝试开展此类业务。同时,为获得政府部门认可,正在考虑申请沙盒监管试验,以探求数据共享利用的业务和监管新模式。(作者:浙大城市学院 谭立;杭州长三角大数据研究院 孔俊) 

每日必读

专题访谈

合作站点