1. 数据开放
数据开放主要是指政府数据面向公众开放。该方式主要适用于非敏感、不涉及个人隐私的数据,并且需要保证数据经过二次加工或聚合分析后仍不会产生敏感数据。
2018年1月,中央网信办、国家发改委、工信部联合印发了《公共信息资源开放试点工作方案》,确定在北京、上海、浙江、福建、贵州开展公共信息资源开放试点。在统一开放平台、明确开放范围、提高数据质量、促进数据利用、建立完善制度规范和加强安全保障六方面探索形成可复制的经验,逐步在全国范围加以推广。
试点地区重点开放信用服务、医疗卫生、社保就业、公共安全、城建住房、交通运输、教育文化、科技创新、资源能源、生态环境、工业农业、商贸流通、财税金融、安全生产、市场监管、社会救助、法律服务、生活服务、气象服务、地理空间及机构团体等领域的公共信息资源。到2018年底,在统筹协调、组织实施、运营保障、数据开发利用及保护等方面形成有效机制,在平台建设、目录编制、数据管理、考核评估、监督检查及安全保护等方面形成一批制度和标准规范。
在促进数据利用方面,试点地区要积极推动公共信息资源的开发利用;要加强宣传引导,积极营造全社会广泛参与和开发利用公共信息资源的良好氛围;鼓励通过政府专项资金扶持和数据应用竞赛等方式,支持社会力量利用开放数据开展创业创新,促进大数据产业发展;引导基础好、有实力的机构和个人利用开放数据开展应用示范,带动各类社会力量开展数据增值开发;对于大规模、连续利用数据服务的机构和个人,要实行网络实名登记管理。
在建立完善制度范围方面,试点地区要制定公共信息资源开放管理办法,明确部门责任分工、开放流程、质量管理、安全保障、绩效评估及监督检查等内容;制定公共信息资源开放平台技术规范,明确平台总体架构、业务流程、应用功能、服务接口、平台间对接方式、用户交互方式、网络安全保障及运行维护等要求;根据国家《政务信息资源目录编制指南(试行)》制定本地区开放目录,并明确主题分类、开放部门、数据属性、更新时限、开放类型、开放方式及使用要求等内容。
在加强安全保障方面,试点地区要切实加强公共信息资源开放安全保障工作;网络安全技术措施要与公共信息资源开放平台同步规划、同步建设、同步运行;要建立健全公共信息资源开放安全管理制度和保密审查制度,加强动态管理,落实各项安全保护措施;建立健全公共信息资源开放应急工作机制,制定应急预案,定期组织演练;制定公共信息资源开放安全风险评估制度,定期开展安全评估,特别是不同领域数据汇集后的风险评估,对存在的问题进行督导和及时解决。
上海市政府数据服务网作为全国首个政府数据服务网站,承担着对外数据开放、提供检索下载服务等功能,并且部分数据已被信息服务企业调取利用,政府数据的经济价值初步显现。在数据开放层面,截至2018年初,上海市政府数据服务网已开放数据项总量57551条,开放数据资源1564个,涉及开放数据部门42个。网站通过三个双向模块——数据导引、数据获取、互动交流对部分政府数据进行公开,用户在获取数据后可以直接分析。这些数据经过国家安全、商业机密和个人隐私的审核,用户可以对数据进行预览,先行了解数据文件中所含的数据字段和样例。同时,为了跟踪开放数据的使用情况,为下一步数据的开放提供经验,用户需要注册后才可以下载利用。
2. 数据交换
数据交换主要是政府部门之间、政府与企业之间通过签署协议或合作等方式开展的非营利性数据开放共享。一般有两种情况。一种是为信用较好或有关联的实体之间提供数据交换机制,由第三方机构为双方提供交换区域、技术及服务。这种交换适用于非涉密或保密程度比较低的数据。另一种是针对敏感数据封装在业务场景中的闭环交换。通过安全标记、多级授权、基于标准的访问控制、多租户隔离、数据族谱、血缘追踪及安全审计等安全机制构建安全的交换平台空间,确保数据可用不可见。
浙江“最多跑一次”改革就是基于打通“信息孤岛”,实现数据开放共享的政务实践。以办理不动产登记证为例,在数据开放共享改革之前,个人需要向国土、住建、地税三部门递交65份600页材料,数据开放共享后只需要递交17份200页材料,在住建和地税部门共享(住建部门房产交易信息办完以后共享给地税用于税费核算交费),并最终由国土部门办理证件。这个过程中既有受理材料共享,也有联办部门办理信息共享给下一个部门。基于这样的数据开放共享,办证时间大大缩短,实现了“1小时领证”。
不光是政府之间的数据交换共享,政府与企业之间已经合作开展了一些实践案例。
2013年2月25日,国家食品药品监督管理总局与百度在北京联合举行“安全用药,搜索护航”战略合作签约仪式。国家食品药品监督管理总局的三大药品数据库,总计20余万条权威药品信息全面入驻百度。
2014年5月27日,中国气象局公共气象服务中心与阿里云达成战略合作,共同搭建“中国气象专业服务云”,面向有气象数据需求的企业提供专业化的云计算服务。
2017年7月,腾讯与中国地震应急搜救中心达成战略合作,中国地震应急搜救中心将依托腾讯位置服务大数据,助力防灾、减灾、救灾决策。腾讯位置服务是国内领先的LBS大数据服务平台,自2018年9月上线以来己形成了公安、旅游、城市规划、房地产及商业等多个垂直行业解决方案,目前每日覆盖6.8亿人,日均定位量超过了500亿次。
2017年11月,国家信息中心与京东金融在京签署《关于加强信用信息共享的合作备忘录》。国家信息中心依托“信用中国”网站的数据共享专区,通过查询检索、数据服务接口及数据文件下载等服务方式,向京东金融共享并定期更新可向社会公开的公共信用信息;京东金融将根据业务需要,对获取的公共信用信息进行加工、整理及导入相关业务系统,并依据业务审核规则对相关守信企业和个人在京东金融及其关联方进行授信申请或享受金融服务时给予相应的激励措施,对受惩戒企业和个人进行严格审查并采取相应的限制措施。早在2017年2月,国家信息中心就曾与京东集团签署《关于加强信用信息共享共用和推进电商领域信用建设的合作备忘录》。截至2017年底,京东已向全国信用信息共享平台提供了1.5万条内部抽检、舆情监控数据。
3. 数据交易
数据交易主要是对数据明码标价进行买卖。目前,市场上比较多的第三方数据交易平台提供的主要是这种模式。
从全国范围来看,2015年前成立并投入运营的有北京大数据交易服务平台、贵阳大数据交易所、长江大数据交易所、东湖大数据交易平台、西咸新区大数据交易所和河北大数据交易中心。2016年新建设的有哈尔滨数据交易中心、江苏大数据交易中心、上海大数据交易中心以及浙江大数据交易中心。据《2016年中国大数据产业白皮书》不完全统计,2015年我国大数据相关交易的市场规模为33.85亿元,预计2020年将达到545亿元。
基于大数据交易所(或交易中心)的交易模式是目前我国大数据交易的主流模式,比较典型的代表有贵阳大数据交易所、长江大数据交易所及东湖大数据交易平台等。这类交易模式主要具有两个特点:一是运营上坚持国有控股、政府指导、企业参与、市场运营的原则;二是股权模式上主要采用国资控股、管理层持股、主要数据提供方参股的混合所有制模式。该模式既保证了数据的权威性,也激发了不同交易主体的积极性,扩大了参与主体范围,从而推动数据交易实现从商业化向社会化、从分散化向平台化、从无序化向规范化的转变,将分散在各行业不同主体手中的数据资源汇集到统一的平台中,通过统一规范的标准体系实现不同地区及不同行业之间的数据共享、对接和交换。
交通、金融、电商等行业分类的数据交易起步相对较早,由于领域范围小,所以数据流动更方便。同时,基于行业数据标准,较易实现对行业交易数据的统一采集、统一评估、统一管理、统一交易。2015年11月,中科院深圳先进技术研究院北斗应用技术研究院与华视互联联合成立了全国首个交通大数据交易平台。2017年9月,海南省政府花费500万元采购通信运营商一年的相关数据。
近年来,我国以数据堂、美林数据、爱数据等为代表的数据资源企业渐具市场规模和影响力。区别于政府主导的大数据交易模式,数据资源企业推动的大数据交易更多是以盈利为目的,数据变现意愿较其他类型的交易平台更强烈。数据资源企业生产经营的“原材料”就是数据,在数据交易产业链中兼具数据供应商、数据代理商、数据服务商及数据需求方多重身份。其在经营过程中往往采用自采、自产、自销模式并实现“采、产、销”一体化,然后通过相关渠道将数据变现,进而形成一个完整的数据产业链闭环。正是因为这种自采、自产、自销的新模式,数据资源企业所拥有的数据资源具有独特性、稀缺性,交易价格一般较高。
以百度、腾讯、阿里巴巴等为代表的互联网企业凭借自身拥有的数据规模优势和技术优势在大数据交易领域快速“跑马圈地”,并派生出数据交易平台。这种大数据交易一般是基于企业本身业务派生而来,与企业母体存在强关联性。一部分数据交易平台作为子平台,数据主要来源于“母体”并以服务“母体”为目标;也有一部分数据交易平台脱离“母体”而独立运营,即便如此也能看到“母体”的影子。以京东万象为例。京东万象作为京东的业务组成部分,其交易的数据和服务的主体与电商息息相关,而且交易数据品类较为集中。尽管京东万象的目的是打造全品类数据资产的交易,但目前主推的仍是金融行业相关数据,而现代电子商务的发展离不开金融数据的支撑。
中国大数据应用于交易刚处在起步阶段,90%的投资都投向了数据清洗、数据整合,数据计算和存储、数据分析和应用方面仅占投资的10%。而且,外部数据价值应用更有限。(文章来源:计算机与网络安全)