在近期公布的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》中,“数据”被纳入市场化配置改革的五大基础生产要素,与土地、劳动力、资本、技术等传统要素并列。
文件提出要加快培育数据要素市场。“数据”与土地等传统要素的区别有哪些?制约数据市场化交易的瓶颈是什么?个人隐私与数据市场化交易间的平衡如何取得?澎湃新闻(www.thepaper.cn)记者专访了上海交通大学数据法律研究中心执行主任何渊。
何渊表示,“数据”作为中国下一步发展数字经济的底层支撑,其重要性不言而喻。但距离市场化交易仍有很长一段路要走,用户同意等法理问题与数据确权等技术问题是其瓶颈。他提议,为使数据能顺利进行市场交易,可考虑向科技公司开征“数据税”。
澎湃新闻:数据纳入市场化配置改革基础要素的意义是什么?
何渊:这不是“数据”作为基础生产要素与其他几大要素第一次并列。去年,十九届四中全会《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》最早提出将数据作为市场化生产要素之一。
本次出台的文件则具体细化了下一步“数据”市场化配置体制机制改革的方向,即首先从推进政府数据开放等三个方面加快培育数据要素市场,先把这个市场培育起来。
在我看来,将“数据”与土地、资本等传统基础要素并列,是为了突出其在接下来我国重点发展的数字经济中的重要性。
在以大数据、人工智能、等技术为代表的“第四次工业革命”中,中国想领先,想在数字经济上超越欧美,“数据”是最基础的。5G和人工智能是数字经济的双擎驱动,但其最底层逻辑仍然是数据。
实际上,这次从中央到地方政府是同步行动,我们看到一系列后续文件,国家发展改革委、中央网信办联合印发《关于推进“上云用数赋智”行动培育新经济发展实施方案》,地方政府层面,上海随后公布了《上海市促进在线新经济发展行动方案(2020-2022年)》。
澎湃新闻:数据与土地、资本等其他要素有何本质不同?
何渊:数据在本质上与其他传统要素有很大差别。
首先,数据没有独占性,我用了,你还能再用,互不影响。不同人拿到同一批数据可以玩出完全不同的花样来,与不同的算法结合可以开发出很多有意思的App。
其次,数据没有稀缺性,现在我们每天不断地生产新的数据,呈指数级增长,未来5G时代更加不可想象。所以把“数据”比作“石油”我觉得不恰当,未来从智能马桶到智能门锁,万物互联,所有电子产品都可能收集数据。
最后,数据的价值会很快衰减,最新的数据价值很大,两年后这些数据就没有大的价值了。正是因为具备这些与传统要素完全不同的特性,所以必须让数据流动起来,你把一批数据存个十年,期间花费储存成本不说,等拿出来后,一点价值都没有了。
澎湃新闻:目前制约数据市场化交易的瓶颈是什么?
何渊:目前面临的主要是法律上和技术上的双重困境。
首先说法理层面,我们现在的重点是强调数据保护,因为企业侵犯个人隐私数据的事件太多了。现在《网络安全法》第42条是主要依据,规定企业未经被收集者同意,不得向他人提供个人信息。也就是我们现在首次打开App都会点的那个用户协议。
同时这个第42条还规定,经过处理无法识别特定个人且不能复原的不属于限制范围。也就是依照现有法律,经过匿名化处理的数据其实是可以交易的,因为这时已经是商业化的数据了,不再涉及个人信息。
但是随着大数据时代的来临,我们会发现无论是取得用户同意还是数据匿名化都越来越难。5G时代来临,所有电子产品都会不断生成数据,面对海量数据,全部取得用户同意需要极高的合规成本,企业是难以承受的。
这也是现在合法的数据交易很少,但黑市数据交易却不断的原因。因为如果要完全符合法律要求,成本将非常高。比如个人可以要求企业删除他的个人数据,但这是十分困难的,因为所有数据已经不断融合,要找出特定个人信息的成本太高了。
另一方面,数据匿名化是一种小数据时代的策略,大数据时代,不同的数据库互相“撞库”,还是很容易分析出个人信息的。
其次,还存在技术层面的障碍,即“数据确权”问题。因为任何东西拿到市场交易它的产权必须是明晰的。数据这个东西现在就难说了,我怎么知道这个数据是你的而不是你从别的地方拿到的?坦白讲,我怎么知道你的数据干不干净,是不是从黑市买的?
这两个问题不解决,数据就很难形成市场。当前我国也是存在三十几家数据交易市场,但大多不能算成功,只有上海和贵阳的数据交易中心做的有些起色。
他们分别是两种模式的代表。上海大数据交易中心类似股票交易中心,只起中介作用,自身不接触数据,从买卖数据的上下家收取佣金。贵阳大数据交易中心则是先把数据买过来,再卖给下家,赚取差价。从模式上来看,贵阳的更赚钱,但是风险也较大,因为你接触了数据,就像我刚才讲的,很难判断数据是不是干净的。
澎湃新闻:那么你认为怎么才能突破这两重障碍,在数据市场化交易和个人信息保护上取得平衡?
何渊:这是一个世界性的难题,现在还没有国家能够很好地解决。
首先,要将个人信息和隐私进行区分。这点我们的《民法典(草案)》已经做出探索,有专章讲“隐私权和个人信息保护”。
据民法典草案,隐私是自然人的私人生活安宁和不愿为他人知晓的私密空间、私密活动、私密信息。自然人享有隐私权,任何人不得侵害他人隐私权。
而个人信息则是以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人的各种信息,包括自然人的姓名、出生日期、身份证件号码、生物识别信息、住址、电话号码、电子邮箱地址、行踪信息等。
区分隐私和个人信息后,才可以着手解决包含个人信息的数据交易问题。
我个人认为可以借鉴“肖像权”的做法,即主张人格权的财产利益,原则上要经过同意才能使用你的肖像,而且要支付一定费用。数据也可以采取类似做法,鉴于我上面说的搜索数据取得个人同意的成本过高问题,可以采取“通知”的形式代替“同意”,除非当事人拒绝公司使用他的数据,否则就可以用,当然同时需要支付对价,这样法理层面可能做出突破。
作为回馈,公司可以以两种形式将费用返还给提供数据的个人,分别是逐一个体返还和群体返还。个体返还这种方式不太现实,还是成本过高的问题,面对庞大的数据提供者,可能公司为了付给每人1块钱的成本都不止1块。
所以我提议可以设计一个“数据税”,使用了数据的公司向政府缴纳“数据税”。政府再把这笔税收投入到信息基础建设中,进而让每个公民都分享这笔收益。法国、英国及印度等国已经开始在这个方向逐步探索。
另外一个“确权”问题目前确实没有什么太好的解决办法,因为面对数以亿计的数据,很难判断来源是否合法、路径是否清晰。但现在区块链技术让我们看到一线曙光,未来也许可以通过分布式账本记录下数据的来源路径使其无法篡改,达到数据权利清晰可交易。
法律框架和技术层面要同步提供支撑,数据才能顺畅上市交易,缺一不可。
澎湃新闻:你所指的数据“确权”是指产权吗?难道不是属于产生数据的自然人吗?
何渊:目前在法律上这个问题其实是没有说清的,也就是说企业拥有数据的什么权利,并不清晰。
但杭州互联网法院的判例已经明确,企业对数据是享有一种权利的,是一种竞争性的利益,因为毕竟企业收集整理数据花费了一定成本,付出了人力和物力,所以理应拥有这部分权利。
但肯定不是所有权,“确权”不一定是所有权,使用权也是一种权利。所以我们还面临一个数据的所有权和使用权分离的法理难题,这也是需要下一步在理论上有所突破的。
澎湃新闻:假设上述障碍可以突破,数据交易会以怎样的形式进行?
何渊:未来可能有五种数据交易形式:(1)公司与公司之间直接交易;(2)数据交易市场,比如前面说过的上海和贵阳的模式;(3)企业联盟之间小范围数据共享;(4)出现专门做数据交易平台的企业,相当于在淘宝上买东西一样买数据;(5)政府开放数据。
政府应该率先出来开放数据,据统计60%至70%的数据掌握在政府手中,政府带头开放的话,企业在合规上的压力会小很多,因为政府数据的来源是可靠的。
这也是我们这次文件中首先提出要推进政府数据开放共享的意义,先从各部门之间数据共享做起,之后向社会开放,进而促进公司之间数据流通。
这种数据开放有别于目前的政府信息公开,信息公开是直接可以看的,数据开放则是开放原始数据,可以直接机读分析利用。
澎湃新闻:一旦数据上市流通交易,怎么保证不会发生大规模的个人数据泄露事件呢?
何渊:这涉及一个数据分级的问题。首先是区别隐私和个人信息,诸如性生活数据、身体缺陷数据等,这种数据是任何情况下都不能拿出来交易的。
区分隐私和个人信息后,应当再将个人信息数据区分为重要数据、敏感数据和一般数据等。
所谓重要和敏感数据,即金融、健康等数据,不仅仅涉及侵犯个人信息,还可能威胁公共安全,这种数据要特殊对待,予以重点保护。剩下的一般数据,则可以在匿名化的情况下上市交易。
其实选择个人数据保护还是鼓励数据流通,在总体保持平衡前提下,每个国家的选择不同,像欧盟就强调个人数据保护,美国则比较提倡数据流动。我个人判断中国如果想在未来数字经济上领先欧美,可能会稍稍偏向于鼓励数据流动。
不管我们愿不愿意去面对,个人终将对自己的一部分数据失去控制的社会或许已经到来。
这里非常重要的一点是,鼓励数据流动的前提一定是做好数据保护,对于违法行为的打击力度一定要加强。这方面我们目前的处罚力度还很不足,和欧美相差太远,欧盟通用数据保护条例(GDPR)中最低一档的最高处罚金额也达到1000万欧元或公司全球2%的营收。
目前,我国《个人信息保护法》《数据安全法》正在制定过程中,我相信这两部法律中一定会大大提高对违法违规行为的惩处力度,届时对个人数据的侵害肯定会大大缓解。(本文源自澎湃新闻,记者:韩声江,责任编辑:李跃群,校对:刘威。)