ks凯时客户端登录

探索中的隐私计算:天冕联邦学习平台落地案例

作者:admin 发布时间:2022-01-10

  联邦学习(Federated learning)在保证数据隐私性的前提下,使用分散在各地的数据,训练机器学习/深度学习模型,从而在遵守隐私保护法律的前提下,通过协作建模,提升机器学习的效率,其在金融、零售、自动驾驶等领域已有广泛应用。

  继《网络安全法》、《数据安全法》、《个人信息保护法》陆续实施之后,国家对网络安全、数据安全、和个人信息安全都有了明文严格的法律法规保护与制约。

  毫不夸张地说,数据安全已经成为了整个时代都关注的重要议题之一。跨机构的数据要素融合应用充满了挑战,而隐私计算技术发明的初衷,便是服务于各方数据在合作中不被泄露的诉求,其解决最根本的问题是隐私数据的安全性。

  天冕科技自2019年8月获得的第一个国家知识产权局的发明专利证书“欺诈检测和风险评估方法、系统、设备及存储介质”的评估方法之后,就展开了对隐私计算技术的深入探索,其布局时间远早于隐私计算风口到来之时,彰显出天冕科技在创新科技研究方面超前的战略眼光。

  如果我们把创新技术的商业模式按照IT系统和应用平台两种类型来划分,则隐私计算技术的应用从现阶段来看,更偏向于定位成一个应用平台。该类型的划分在业务逻辑上有着很大的区别。IT系统,在应用中的最终价值,是帮助使用方节省成本;应用平台,则可能对具体使用方有提升业务的作用。目前隐私计算技术的作用更偏后者,其根本价值,主要是使得机构能够将内外部数据结合起来对用户进行分析,从而提升业务收入。在这样的大背景下,一种基于数据隐私保护技术实现的分布式训练范式——联邦学习应运而生,逐渐受到学术界和工业界的广泛关注。

  天冕联邦学习平台是天冕科技利用前沿信息技术打造的高效安全数据合作解决方案。该平台可以充分保护各方用户数据安全,打破数据孤岛,支持企业按照具体的建模场景,沟通并匹配其他联邦成员,在明文数据不出库的前提下,共同完成联邦模型的训练与构建,帮助建模人员快速搭建联邦学习任务(横向联邦、纵向联邦、纵横向混合联邦等),促进联邦成员间的交流与共赢;在保护数据隐私的同时,深度连接各个合作方,实现跨数据、跨行业的合作共赢。

  背景:某头部互金公司需要对存量沉默用户进行激活营销,仅使用现存自有数据特征进行建模或者仅参考第三方数据评分只能达到收支平衡,然而引入线下第三方数据进行联合建模的方式又存在用户数据泄露的风险;通过使用天冕联邦学习平台,在自有数据特征的基础上引入第三方数据进行联合建模,有效提升了模型效果和营销ROI。

  实施过程:该头部互金公司抽取30万的存量沉默用户(已注册但未曾进件)作为样本,结合某数据服务商提供的第三方数据,依托天冕联邦学习平台进行联合建模之后,将用户特征维度扩?至上千维度,然后抽取样本中70%的沉默用户作为训练模型,并用该训练模型对剩余30%沉默?户进行评分预测。

  结果显示,分值越高的用户,进件概率越?,在训练模型中分值排名前5%的样本用户里,预测的进件准确率能达到3%(较以往单独建模预测进件准确率为1%)左右,这说明了该训练模型对于有贷款需求的用户具有较高的预测性。

  与此同时,天冕科技对?了该头部互金公司单?建模和多方联合建模的模型效果,从模型角度和最终预判的贷款需求用户数量来看,联合建模?单方建模在AUC、KS等指标上具有更好的区分度和排序性,在对前10%评分高的用户营销后,模型KS提升11%。通过使用天冕联邦学习平台建模后,该头部互金公司本期营销收入增加了68万。