▏摘要
为促进中国移动跨行业数据合作生态发展,中国移动基于隐私计算技术,融合“敏捷”理念,打造运营商跨行业数据融合服务模式,实现数据要素的可信、可靠开放共享,快速响应跨行业数据合作需求,支撑金融、政务、医疗和互联网企业等领域客户,开展联合风控、电子政务、智慧医疗、联合营销等场景应用。
▏关键发现
• 隐私计算统一底座旨在打造集中化管控服务的概念,实现管理界面功能。基于统一底座,中国移动集成自研计算平台,提供多方计算、隐匿查询、联合求交、联邦学习等四大基础功能,同时融合外部隐私计算厂商的算子算法能力,通过能力间的互相打通,解决跨机构互联互通难的问题;
• 隐私计算采用复杂的加密机理,交互次数多,导致大量的计算和通信负载,同时由于“木桶效应”,整个计算建模流程将受限于性能较弱的一方,对各参与方的计算、网络等资源提出更高要求。在基础业务需求之上,需根据业务发展开展平台的滚动规划,不断优化平台性能,赋予隐私计算技术体系发展与业务适配磨合间充分的灵活性,以充分支撑数据流通和数据价值释放;
• 使用隐私计算相关技术对个人信息进行加密处理,是否符合“去标识化”、“匿名化”的相关要求,目前尚未明确界定。因此在现阶段的具体实践中,参与团队应确保遵守国家相关规定,采取用户明示授权等方式确保合法实施数据要素共享,切实保障数据要素应用全流程合规。
分享专家:刘若宽,中移信息技术有限公司项目经理
作者:沙丘社区分析师团队
01
案例企业
中移(动)信息技术有限公司(简称“中移信息”),是中国移动通信集团有限公司下属的全资子公司,公司致力于加强IT领域的全网统一指挥、系统统筹规划、资源统筹配置和能力统筹运营,推动全网基础资源集中共享,聚焦成为数智化转型的先锋、智慧服务的基石、自主创新的表率、数据赋能的专家,成为数智化转型、高质量发展的重要引擎。
中国移动通信集团广东有限公司(简称“广东移动”)隶属于中国移动通信集团有限公司,是国内最大的省级通信运营商,用户数市场规模第一(超过1亿户),服务的政企客户包括BATJ等互联网企业、重要党政军单位及银行、证券、保险等,致力于深度融合应用信息技术和数据要素,促进粤港澳大湾区跨行业跨领域数据资源共建共享共用,助力推动广东经济社会高质量发展。
02
项目背景
2020年国家发布《关于构建更加完善的要素市场化配置体制机制的意见》,2021年国家发布《国务院关于印发“十四五”数字经济发展规划的通知》,国家相继出台政策,提出“加快培育数据要素市场”的战略方针。
同时,中国移动董事长杨杰提出“搭建一体化的创新网络,加快跨行业跨领域数据资源共建共享共用”的工作要求。
因此,中国移动亟需加快信息技术和数据要素的融合创新,探索运营商与金融、电力等垂直行业数据融合新模式,解决前期隐私计算实践遇到的数据融合、技术管控、全流程融通等问题,进一步培育扩大中国移动数据要素对外开放合作新生态。
03
解决方案
为解决跨行业数据融合创新和实践中面临的数据“合规”融合难,合作厂商多、管控弱,应用全流程孵化效率低,标准化服务场景单一等问题,中国移动基于隐私计算技术,融合“敏捷”理念,打造运营商“1+X+5+1”跨行业数据融合服务,助力中国移动与各行各业携手联合创新,共筑大数据生态、共谋大数据发展。
在组织架构支持上,广东移动组建了“公司领导挂帅,信息系统部部门总经理+隐私计算专家+隐私计算算法工程师+业务专家”的百人专家团队,制定一系列隐私计算数据安全管理相关的管理制度。
项目于2020年启动,至今共投入近千万经费用于隐私计算平台建设,积极推动隐私计算平台载体、数据能力、全流程敏捷服务探索实践,助力公司数智化转型发展。
解决方案整体架构基于源系统数据,通过PaaS平台、自助分析、标签库等大数据平台工具组件,完成数据集成、数据基础加工、数据探索、数据预处理等基础工作,然后将源数据加载到多方安全隐私计算生产域,通过多方安全计算、隐匿查询、安全求交、联合建模等技术,集成外部隐私计算厂商的标准能力,通过隐私计算底座管控防护能力,为银保监、人行、平安银行、浦发银行等客户侧节点提供隐私计算服务。
在“1+X+5+1”的数据融合服务模型中:
“1+X”是指基于唯一底座、融合X家隐私计算企业的算法能力,解决“跨行业对接厂商多、各厂商平台差异大、管控难”等问题。
隐私计算统一底座主要用来打造集中化管控服务的概念,实现数据流通管理、数据管理、合约管理、计算编排、密钥管理、计算资源管理、算子算法API管理、任务调度管理等管理界面功能。
基于统一底座,集成了自研计算平台,提供多方计算、隐匿查询、联合求交、联邦学习等四大基础功能,同时融合外部隐私计算厂商的算子算法能力,通过能力间的互相打通,解决跨机构互联互通难的问题。
“5”是指沉淀5大类数据标准能力,快速支撑通用、共性的隐私计算业务场景。中国移动数据纬度广,通过数据中台对海量数据的加工和价值萃取,聚焦隐私计算场景,建设公共基础、电子政务、联合营销、联合风控、智慧医疗五大类标准化数据能力,打造面向隐私计算场景的通用标签、场景化数据模型,快速交通大数据、旅游大数据、应急大数据、人口大数据、金融大数据等隐私计算业务场景。
“1”是指构建敏捷的跨行业数据融合应用服务模式。通过打通能力开放平台、PaaS平台、自助分析平台和OpenAPI等内部系统之间的链接链路,实现从样本筛选、宽表准备、数据脱敏、联合建模、结果输出、API开放等全流程在线敏捷数据开发,实现端到端的联合安全建模一站式服务。
隐私计算平台的应用场景包括客户画像、标准营销、客户服务、网格运营、多维度信用评级、风控反欺诈、产品精准营销等,广泛支撑金融、政务、医疗和互联网企业等领域客户,开展联合风控、电子政务、智慧医疗、联合营销等场景应用。
在金融服务领域,助力金融行业客户优化金融风控模型,提升反欺诈模型水平。在安全合规的前提下,通过将用户个人数据在不出库的前提下和消费数据等进行实时欺诈模型计算,对包含网络诈骗、交易诈骗、虚假流量、盗号盗卡等进行识别建立反欺诈体系,广泛应用于信贷风控、反欺诈、反洗钱等金融服务场景,降低企业损失,打击黑灰产业。
2021年2月至12月,广东省银保监局联合广东移动共同开展隐私计算技术实践,实现金融业数据融合共享,对10家银行共5亿余条数据进行数据分析,完成基于银行间交易流水数据的资金流向查询的技术验证,实现对公贷款风险识别场景的跨行联合建模和消费信贷风险识别场景的多数据源建模两个应用成功落地。
在政务服务领域,促进政务数据安全共享开放,实现精准施策。融合政府数据和社会、企业数据进行安全计算、联合统计、联合建模,实现数据融合价值,广泛应用于疫情防控、产业政策实施、网络犯罪监测等政务领域服务,促进社会经济的发展和提升政府的治理和服务水平。
在医疗服务领域,数据互通发挥医学数据价值,促进AI技术在医疗领域的发展应用。基于隐私计算开展医疗数据合作方案,实现在数据隐私保护下医学数据安全统计分析和医学模拟仿真和预判,从而进行跨机构的医学影像识别、临床医学研究、疾病筛查、AI辅助诊疗等医疗领域应用,提升医疗领域的数智化水平。
在营销服务领域,跨行业数据融合重构用户画像,实现精准营销。整合多机构间多维度的数据,在不输出原始数据的基础上进行营销模型计算,以构建更立体的用户画像,广泛应用于联合营销、广告精准投放、高价值用户识别等企业营销领域服务,实现企业资源优势互补、开拓市场广度和挖掘市场深度的营销目的。
04
价值与效果
通过引入隐私计算等技术,基于敏捷服务理念,打造面向运营商数据要素跨行业融合的敏捷服务模式,促进公司跨行业数据合作生态发展,获得显著的技术价值、经济价值和社会价值,力促政府、金融、医疗等行业领域客户实现数智化转型。
在技术价值方面,构筑可信、可靠、共享的跨行业数据合作环境。中国移动积极引入新兴技术,探索跨行业数据融合创新。在前期的探索和实践过程中,面临着数据融合、技术管控、全流程融通等问题,制约着跨行业数据融合创新模式的落地实践。为此,中国移动结合运营商自身业务与核心数据要素联合服务场景,探索领先的隐私计算领域实践案例,打造面向运营商数据要素跨行业融合的敏捷服务模式,实现数据要素的可信、可靠开放共享,快速响应跨行业数据合作需求,助力以数据要素为驱动的企业数智化转型。
在经济价值方面,对内对外赋能,助力降本增收、增效提质。在降本方面,支撑广东省银保监局提升对公贷款风险识别和消费信贷风险识别效率,助力减少了20%的运营分析成本。在增收方面,支撑省银保监、人行、广发银行共3家单位跨行业数据融合项目落地,持续为移动公司创造对外变现收入198万。在增效方面,与人民银行广州分行、广州公安反诈中心推进金融反欺诈业务,反诈精准率提升20%。在提质方面,与广发银行共同合作探索营销风控场景、用户挽留场景应用,有效降低营销投诉发生率50%,协助挽留销卡用户1万户。
在社会价值方面,力促政府、金融、医疗等行业领域数智化转型。在运营商行业内,中国移动联合其他运营商通过匿踪查询和联邦学习技术,共同建设诈骗电话识别模型,在保证数据“可用不可见”的前提下进行黑名单共享,解决各个运营商数据覆盖面不全的问题,同时避免用户隐私数据泄露的风险,有效支撑工信部、公安部等部门实施电信网络诈骗治理,降低网络犯罪风险。
在跨行业合作方面,中国移动深入政府、金融、医疗等行业领域,利用联邦学习、多方安全计算等隐私计算技术,在“数据不出库、数据不落库”情况下实现跨行业数据融合,确保数据要素能安全地进行流动,促进各行业实现数智化转型。
05
经验借鉴
通过建设隐私计算平台建设项目,中国移动总结如下关键成功因素:
第一,充分沟通是保障项目应用落地的前提。当前,隐私计算技术与解决方案的不成熟主要体现在对场景的理解上。当新技术摸索新模式时,探索的难点在于,技术团队对目标行业的业务流程是否能够充分理解,尤其是数据业务中的流转动作。本项目落地过程中发现,数据使用方也有对业务流程了解不充分的情况。因此,大量交流与沟通是项目应用落地的大前提,在此基础上,项目团队应对所服务的行业建立全局视角,找到客户痛点,而不是“想象中理所应当的痛点”。
第二,依法合规是数据要素应用共享的要求。数据安全是数据要素市场建设的基本保障。近两年国家、监管、行业层面数据安全相关政策法规、规章制度也密集出台。然而,使用隐私计算相关技术对个人信息进行加密处理,是否符合“去标识化”“匿名化”的相关要求,目前尚未明确界定。因此,在现阶段的具体实践中,参与团队应确保遵守国家及中国移动的相关规定,采取用户明示授权等方式确保合法实施数据要素共享,切实保障数据要素应用全流程合规。
第三,做好规划是平台持续良好发展的关键。隐私计算采用复杂的加密机理,交互次数多,导致大量的计算和通信负载,其中一旦涉及算法更为复杂的深度学习等领域,隐私计算带来的性能瓶颈将使相关建模时长令人无法接受。同时,隐私计算是一种多方同步计算,由于“木桶效应”,整个计算建模流程将受限于性能较弱的一方,这对各参与方的计算、网络等资源提出了更高的要求。因此,在基础业务需求之上,中国移动需根据业务发展开展平台的滚动规划,不断优化平台性能,赋予隐私计算技术体系发展与业务适配磨合间充分的灵活性,以充分支撑数据流通和数据价值释放,进一步为数据业务创造活力。