广告
加载中

清华大学白重恩:数据治理需加快脚步

亿邦动力网 2021/09/04 11:06

【亿邦原创】9月3日消息,在2021中国电子商务大会主论坛上,清华大学经济管理学院院长白重恩教授发表了题为《数字化转型中的数据治理》的演讲。他指出,数据的使用对社会的影响具有不确定性,对数据的治理变得更加迫切,需要有效控制这种不确定性带来的风险。

“流通过程当中,数据怎么得到更好的保护?流通过程当中数据产生的价值怎样分配?这些问题给我们带来了一些新的挑战。”白重恩表示,数据的管控中要遵循保护个人权益、保障社会的利益、提升效率及创新能力、公平分配利益等几大原则。白重恩认为,数据集中可能带来垄断问题,怎样监管也是必须要考虑的问题。

据悉,中国电子商务大会自2011年以来已连续举办十一届,正值“十四五”规划的开局之年,中国电子商务大会将开启新十年征程,总结“十三五”电子商务发展经验,展望“十四五”电子商务发展机遇,守正创新、融合共建,践行电子商务高质量发展,服务构建新发展格局。

温馨提示:本文为速记初审稿,保证现场嘉宾原意,未经删节,或存纰漏,敬请谅解。

以下为演讲实录:

白重恩:非常高兴也很感谢会议的组织者给我这样一个机会来和大家分享一些我的思考。

大家都知道数字经济中数据的重要性,数据成为我们非常重要的新生产要素。如果说能源是工业经济的血液,数据就是数字经济的血液。

但是数据这样一个新的要素,它给我们带来的影响要远远比其他传统要素更加复杂,比如我们给定一个数据集,能够产生什么样的结果就看研究这个数据的人脑子里的理论框架是什么、思考的问题是什么、能力是什么、用什么样的思考来得出答案,这些答案对社会的影响非常不确定,这个和传统要素是非常不同的。因而,我们对数据的治理也变得更加迫切,因为太多的事情不确定,我们需要能够有效的控制这种不确定性带来的风险。

同时也使得我们的治理问题变的非常复杂,再加上数据作为一个要素还非常新,所以很多理论的研究和实践都还在发展的过程中,所以我们现在还在一个探索的阶段。

在这个探索的阶段,对于企业、创业者来说也有很大的不确定性,因为我们不知道未来的治理会是什么样的。

我今天要和大家分享的是我们思考数据治理问题的一些角度,也许我们现在治理的具体措施有一些已经定了,但是实施还有不确定性,一些措施还没有形成法律法规,最后会是什么样还不确定。但是如果对思考的角度能够有一些认识,也许可以帮助我们更好的去思考未来,这是我想和大家分享的一个内容。

首先,为什么谈数据治理,是因为我们在数据的使用中存在很多问题,这些问题如果只靠企业来自律或者只靠个人和企业本身来保护自己的权益,可能是不够的,需要有一个治理的框架,由政府或者是行业协会、其他形式给我们提供一些规则。

这些问题是什么?当然这个也不一定全面,比如对个人信息的保护,每个人都很关心自己的隐私,尤其一些个人信息如果不当使用,可能给我们带来很大的伤害。特别是我们的一些生物信息,和身份认定紧紧绑定在一起,如果信息被盗用给我们损害很大。

数据使用可以给我们带来很多的收益也可能带来很大的风险,比如我们都不喜欢被数据杀熟,在一个平台上多次进行交易以后,平台通过数据分析对你的消费行为有了更加深入的了解,如果不加以管制,这个平台利用对我们行为的了解做对我们利益不完全一致的事情,所以我们很关心数据个人信息的保护。

数据的权属,这个和其他要素也不一样,比如土地也是一个重要要素,权属非常清楚,即使是一些不那么传统的要素,像知识产权,往往它们的权属也比较清楚。但是当一家企业,各个平台从众多消费者收集数据形成数据集的时候,这些数据原来的载体、个人是不是有权属?是不是他的权益也要得到一定的考虑?

因为数据影响非常大,同时使用不确定,所以会带来想不到的国家安全的问题,也会带来一些对公共利益的影响,比如数据往往会形成一个经营很集中的平台,因为收集数据有经济的规模效应,形成一个大的平台,这个在经济和社会中起到举足轻重的作用,这样一个平台如果使用过程当中出现问题会不会造成系统性的风险?这也是公共利益必须要考虑的问题。

刚才说过数据往往很集中,形成了平台的企业,他们有垄断的地位,是不是利用了这个垄断的地位采取了一些垄断的行为,对竞争对手产生不利的影响,对消费者产生不利的影响。

往往一个数据和另外一个数据加起来价值会更大,我们希望数据能够流通,但不同数据有不同技术标准,对接起来技术上就有困难。更多是有没有激励政策让这样的数据能够流通起来,能够形成更大的价值。以及在这个流通的过程当中,数据怎么得到更好的保护?流通过程当中数据产生的价值怎样分配等都是给我们带来了一些新的挑战。

所以我们存在很多的思考,我们在监管方面、在法律法规方面已经采取了一些措施,逐渐向更加完善的治理体系在发展,但是未来还有很长的路要走。

在考虑这些问题的时候,刚才提到很多问题,要解决这些问题就要思考我们要遵循什么样的原则,在这里我想提出几个方面的原则:

1、保护个人权益,很多数据来自于个人,我们个人对于隐私、利益很关注,在数据治理中应该考虑个人权益。

2、社会的利益,国家安全和对整个公众利益的影响。

3、效率,这一点特别重要,因为数据的良好的使用可以产生很大的价值。我们把不同的数据集融合在一起设计的算法、得到新的结果,这个方面效率改善空间非常大。保护社会利益、个人权益的同时,还要让效率得以体现。

效率很重要的方面就是创新,刚才谈到给定数据,不同的人用不同的角度看数据会得到不同的结果,需要很多创意、努力,需要保护创新的动力,这是在数据治理中必须要考虑的问题。

利益的分配需要公平,尤其数字经济中生产活动相对更加集中,比工业社会更加集中,这个时候怎样保证公平,也就变成了一个更大的挑战。

以上是我们考虑数据治理中必须要考虑到的原则。具体到采集数据、利用数据和让数据流通各个环节,我们又有很多需要考虑的问题。比如说采集数据,如果向消费者采集数据,自然消费者很关心数据会被怎样使用,有的时候我们很担心这样的数据会不会使用了以后对我不利,所以我们的思路是采集数据的时候,应该把使用数据的目的向消费者说清楚,不能用作其他目的。

当然这对于创新、对于效率会有一定的影响,但我们保护消费者的权益、保护个人的权益就更加重要。

把目的说清楚以后,还需要征得消费者的个人同意,如果我采集这个数据是为了这个目的你是否同意我收集这样的数据,讲目的的时候还要避免误导行为,收集数据以后对于数据的储存、流通也要有一些严格的保护措施,对数据使用也要有一些规范,不应该侵犯消费者的重要权利。

在这方面我们做了很多的工作,刚刚公布了《个人信息保护法》、《数据安全法》、《反垄断指南》,这些和我们说的这些事情有重要关系,其中原则基本上都是平衡个人权益、社会利益、效率、创新、公平几个方面。

数据中重要的方面就是政务数据,除了收集数据的政府部门本身使用之外,应该让它能够更加广泛的得到使用,这就要我们对政务数据的分享做一些规划安排。这个过程当中需要对数据进行脱敏,怎样进行脱敏处理?脱敏以后怎样对安全分级做的更加有效,使一些不是很敏感的数据得到更加广泛的使用?这些都需要做更多的工作。

如果由每一个部门自己决定是否分享其数据,那这个工作很难推动下去,可能需要一个具有全局观的机构来推动和执行信息脱敏处理、分类以及数据共享的规范。

社会数据,不管关于个人还是机构的,社会数据的流通和交流中、交易中也有类似考虑,我们也需要做一些脱敏处理,因为这个数据中往往包含个人数据。怎样把数据匿名化,或进一步做到不管怎么分析都没有办法恢复实名,这是我们需要做的工作,脱敏以后仍然需要进行安全分级,对不同级别的数据来进行不同的规范。

在交易中,有很多技术的问题,往往在数据的交易中不会拿一个U盘就把数据拷给你,更多通过某一种技术手段把这种数据集中在某一个平台上进行交易。

这个平台有很多安全问题需要处理,有很多沙箱,每个沙箱数据是保密的,但是设计一个算法能够利用来自各个沙箱的数据,同时不泄露各个沙箱数据的秘密,在保护安全的同时还能够发挥它的价值,这方面在技术上已经有了很大的进展。

但这需要我们建立这样的交易场所,需要有比较好的基础设施,还要有良好的治理的方式,使得这样的交易能够满足我们前面说的几个原则。

权益的分配,这也是一个很重要的问题,尤其是关于个人的权益的问题,因为数据可能来自千千万万的个人,如果和每一个个人都商量分配显然是不可能的。所以我们就要考虑怎样让个人的权益得到保障。

我们也有技术上的手段,利用区块链等科技手段对个人信息的使用进行收费,并分配给个人,技术上可以做到,怎么做需要规范。

另外一个思路是通过税收来解决这样的问题,大家都提供数据,我们对数据的使用所产生的收益进行征税,一部分返还给消费者。

采集者、开发者、使用者之间的权益分配,也是和其他要素相比更加复杂,所以我们要有更多的思考。

刚才也谈到,数据比较集中,可能带来垄断问题,我们怎样来监管,这也是我们必须要考虑的问题。监管就是我们现在面临的特别大的挑战。所以考虑监管的时候要综合考虑各个方面的原则,但是因为很多数据的使用很新,使用的方法也很多,如果都靠人去监管可能越来越困难,我们未来要更多的思考怎么利用科技手段进行监管,让人工智能的各种各样的方式帮助我们的监管变得更加高效。

这就是我想和大家分享的关于数据治理的一些想法,谢谢大家!

文章来源:亿邦动力网

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享
+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0