摘 要:
《大数据时代》的作者Viktor·Mayer-Schonberger曾说过:“政府不需要去补贴和建立所谓新兴产业, 只需要开放政府的数据, 就能培育一个新的增长点——新型的服务业。”政府开放数据运动席卷全球, 上海市政府数据服务网 (www.datashanghai.gov.cn) 早在2012年6月就已上线, 成为中国大陆地区首个政府数据开放平台, 目前已涵盖了经济建设、资源环境、教育科技、道路交通、社会发展、公共安全、文化休闲、卫生健康、民生服务、机构团体、城市建设等11个重点领域。
近年来, 开放政府数据在许多国家迅速推进, 成为政府信息化领域的热门话题和研究重点。2009年5月, 美国联邦政府数据开放平台www.data.gov正式上线, 成为全球首个一站式的政府数据开放平台, 目前已开放了超过13万个数据集供社会免费下载, 覆盖农业、商业、气候、消费、生态、教育、能源、金融、卫生、制造、海洋、公共安全、科研、地方政府等十多个主题。英国政府也开设了Data.gov.uk网站, 将中央政府与地方政府部门的数据向社会开放。目前已有几十个国家和地区以及国际组织 (如OECD、世界银行等) 在推行政府数据开放。中国的一些地方政府也已开始探索开放政府数据。北京市、武汉市、无锡市、佛山市南海区等许多地方也已建成或正在积极建设政府数据开放平台。上海则是唯一有明确公开开放数据工作计划的城市。其发布的《上海市政务数据资源共享和开放年度工作计划》不但明确了整体的战略部署和年度目标, 也清楚列出当年的数据开放重点领域清单:2014年计划开放190项数据集, 2015年计划开放428项数据集;这份工作方案同时明确了开放政府数据项目相关的配套项目建设 (例如政府数据共享政策和平台的完善) 。在其他地方, 目前只有与智慧城市、大数据等相关的公开性政策文件, 并未对开放数据专门公开发布相应政策, 也未公开相应工作方案。
解本义:政府“开放”“数据”
开放政府数据是指任何人都可以自由、免费地访问、获取、利用和分享政府的数据。具体而言, 政府数据开放包括以下基本原则和要求:
完整:除非涉及国家安全、商业机密、个人隐私或其他特别限制, 所有的政府数据都应开放, 开放是原则, 不开放是例外。
一手:开放从源头采集到的一手数据, 而不是被修改或加工过的数据。
及时:在第一时间发布和更新数据。
可获取:数据可被获取, 并尽可能地扩大用户范围和利用种类。
可机读:数据可被计算机自动抓取和处理。
非歧视性:数据对所有人都平等开放, 不需要特别登记。
非私有:任何实体都不得排除他人使用数据的权利。
免于授权:数据不受版权、专利、商标或贸易保密规则的约束或已得到授权使用 (除非涉及国家安全、商业机密、个人隐私或特别限制) 。
在开放政府数据过程中, 政府开放数据而不自己加工产生产品, 由社会和市场力量来利用数据, 开发产品满足社会需求, 在这个过程中政府和社会/企业实现了合作共存, 一方提供资源, 一方提供加工。政府只需要保证数据质量、及时度和下载, 而不需要操心如何开发。
开放对象:数据而非信息。数据是底层的、原始的、一手的、未经加工的资源。信息是对底层的数据做加工解读, 综合分析的产物, 是二手的结果。因此, 公开信息是第一个层面的开放, 在大数据时代应进一步深入到数据层的开放。开放了原始的数据之后, 社会对于这些数据的加工能力和创造力将是政府无法想象和估量的。
开放目的:开放而非仅公开。信息公开重点强调的知情权, 让公众知道政府在做什么, 监督政府的工作, 并参与到政府的决策中。强调的是政府的透明度, 是政治行政上的责任。开放政府数据是为了保障利用权, 重在公众对数据的再次利用权, 更多强调经济增长和社会发展上的责任。所以信息公开是数据开放的基础, 但数据开放比信息公开在深度和广度上都有一个跃进。
识大体:取之于民, 用之于民
政府数据是行政机关在履行职责过程中制作或者获取的数据, 其经费来自于公共财政和纳税人, 属于公共产品, 产权上归全社会所有。随着政府信息化建设的不断发展, 政府部门生成、采集和保存了大量与公众的生产生活息息相关的数据, 成为一个国家最主要的数据保有者。在不违反相关政策法规和不损害公共利益的情况下, 将政府数据向公众免费开放, 供其利用和开发, 本质上是政府在大数据时代提供的一种公共服务, 从而将取之于民的数据还之于民。
政府开放数据供社会进行增值开放和创新应用, 可以激发大众创新, 万众创业。现在都强调创新, 数据是互联网创新的重要基础, 如果政府不开放这一部分数据, 很多创新应用没有数据作为支持, 只能是一些空壳创新。真正要推动大众创新, 政府开放数据就是一个重要的推手。
开放政府数据, 可以推动经济增长乃至整个经济增长方式的转型, 数据开发者能利用政府开放的数据, 提供更好的服务, 创造更多的价值, 这个过程能够提高整个国家在大数据时代的竞争力。开放数据激发经济活力从而提升税收, 这是一个良性循环, 更是一个创造巨大公共价值的全局性战略。
政府仅仅把数据放到平台上, 政府数据公开工作并没有结束。因为开放数据本身并不会带来价值或社会经济效益, 而要这些数据被社会充分利用, 才能产生效益。因此, 现在国际上很流行的说法是, 开放政府数据是一个生态系统。在数据开放的过程中, 相应政策法规、组织管理、数据质量管理和平台开发决定着政府数据开放的水平;在政府数据开放之后, 数据利用者的利用方式和利用能力将直接影响数据利用效果, 两者间的动态互动关系共同决定着开放数据的价值创造过程。在价值创造机理上, 政府数据从开放、利用到价值创造是一个动态循环的过程。
拦路虎:六大问题亟需改进
目前, 开放政府数据主要面临政策不配套、意识不到位、开放动力不足、部门利益抵抗、数据质量不高、管理能力不足, 安全隐私隐患等方面的阻碍。结合中国各地的开放数据实践, 总结出六大主要问题:
数据量少、价值低、可机读比例低。总体上, 目前各地政府所开放的数据集数量和价值离社会需求仍有很大差距, 无法满足经济发展与社会创新领域的需求, 大量高价值且不涉及国家安全、商业机密和个人隐私的数据未能开放。此外, 开放数据所采用的数据格式决定了数据的技术开放性, 所有数据都提供可机读格式在实践中尚未能实现, 而这将会为数据利用者, 特别是非技术背景的使用者 (例如学者、记者、NGO从业人员等) 增加难度, 尤其是进一步增值利用相关数据。
开放的多为静态数据。开放政府数据应更多开放动态、实时的业务数据, 高价值的动态数据是激发企业、个人开发者进一步增值利用的重要杠杆。在研究评估中发现, 目前各地方发布的数据中平均86.25%的数据是静态数据 (以年为单位更新, 或按需更新) , 仅有平均13.75%的数据属于动态数据 (以月、周、日为单位更新, 或实时更新) , 远不能满足和激发数据利用者的需求与兴趣。开放政府数据并非以数据释放为终点, 对数据的更新维护也是开放政府数据项目的重要工作。
数据授权协议条款含糊。开放数据的授权协议是开放数据生态圈建设的重要元素, 不但可确保开放数据可以自由免费地被使用、传播, 也有益于社会大众理解开放文化, 从而进一步发展出基于开放数据授权协议的商业模式。研究发现, 各地方目前都采用了网站免责条款/用户协议的形式, 对发布的所有开放数据进行了一次性整体授权。在相应的条款上, 则存在较为严重的问题, 尚不符合开放数据的法律开放性原则。
缺乏便捷的数据获取渠道。在数据获取方式方面, 平台的数据获取缺乏便捷性, 大都须进行事先的注册登录, 且平台注册难度较大, 不利于民众快速、便捷地获取平台数据, 多数地方的开放数据平台都未提供数据内容的预览功能, 或者提供了部分数据内容的预览, 由此对民众的积极性和满意度有一定的负面影响。
缺乏高质量的数据应用。有些平台虽然开设了数据应用频道, 但是平台上现存的应用并非可下载、可使用的数据应用, 而仅仅是功能测试之后的结果;有些平台虽然提供了可下载、可使用的数据应用, 但大多并未利用本站数据, 或仅仅浅层次地运用了地理位置等基础数据, 或即使利用了本站数据, 也并未对具体使用了哪个数据进行说明;有些平台提供的“数据应用”名不副实, 实际上地方政府部门的政务业务处理系统, 是开放数据的来源, 而非数据开放后的实际应用。
缺乏便捷、及时、有效、公开的互动交流。在互动交流方面, 多数地方的开放数据平台都提供了对单个数据集的评价功能以及数据请求功能, 建立了用户和政府之间的对话机制。但多数平台的互动交流功能使用都缺乏便捷性, 大多需要事先注册登录。其次, 平台的互动交流功能缺乏及时有效的回应, 有些开放数据平台虽然提供了单个数据集的评价功能, 但是经过试验, 实际情况是可以提交评价, 但一直没有在网页上显示, 至于原因是审核尚未或未曾通过, 还是评价功能有名无实, 则不得而知。
建言策:七条现实改进路径
加强管理架构建设。首先, 建议设立或指定开放政府数据工作的主管部门, 并赋予该部门足够的职权, 以协调统筹其他业务部门的数据, 同时还应明确业务部门和其他相关部门在开放数据工作中的分工与职责。其次, 应尽快制定具有针对性的、切实可行的数据开放政策规范及行动计划, 对开放政府数据的对象、形式、边界进行严格定义, 保证数据开放的规范化和制度化。最后, 建议主管部门编订年度工作方案, 并公开向大众发布, 这将有利于社会公众知晓和参与开放政府数据工作。
提高领导支持力度。开放政府数据项目仅由主管部门推动还远远不够, 地方行政部门公开支持, 无疑是推动这项工作的重要因素。对开放政府数据的目的和意义, 建议各地方行政长官加深理解, 并在地方重要工作会议、公开讲话和实际工作中加强支持, 在政府体系内树立起开放政府数据的观念, 增强数据开放意识, 提升开放数据工作能力建设, 指导并支持主管部门推进开放政府数据工作。
基于社会需求开放。建议主管部门以用户需求为导向, 会同数据发布单位以及数据需求者 (例如企业、个人开发者、记者等) , 以圆桌会议等形式沟通数据需求, 提升开放数据的数量、质量、形式和价值。通过网站和社交媒体上的互动交流, 采集公众需求, 不断改进、完善自身工作, 并为基于政府开放数据开发的应用提供充分的展现平台, 从而激励社会的数据利用。
提升数据可机读比例。建议正在建设的、未来要新开启的开放政府数据项目提升开放数据的可机读率, 保证数据不以PDF、网页、图片等格式发布。这一点不但要体现在开放政府数据项目的本地政策文件或工作方案中, 同时应作为重要的考核指标, 对各数据提供部门进行考核。各地方应当建立完善的数据发布审核流程, 结合自动化检查和人工审查方式, 对发布的数据格式进行严格检验, 确保所释放的数据满足数据格式的开放性要求。
规范数据更新周期。开放数据计划的主管部门应设定相应规范和监督机制, 确保数据及时更新。考虑到开放数据项目对数据发布单位造成的成本压力和运维压力, 数据发布单位可先行调研和实际测试 (通过比赛、特定合作开发等) 特定动态数据的价值, 再由社会机构或企业竞标, 负责相应数据API的开发和维护, 通过PPP公私合作的方式, 将动态数据像水、电、气一样源源不断地开放给社会、服务于公众。
完善数据授权协议。建议参考国际上行之有效的知识共享协议、开放政府协议, 结合中国实际法律环境, 制定出适用于中国的开放数据授权协议条款, 从而清晰、明确地保证用户享有的数据访问、获取、利用和分享的权利及相应义务。
降低数据获取与互动门槛。建议各地方的开放数据平台降低数据获取门槛和互动交流门槛, 使用户无需注册便能获取数据并参与互动。同时, 落实平台互动交流功能的有效性, 即用户所提交的信息应当获得及时的审核、公开乃至回应, 如单个数据集的评价、对数据的请求、对平台整体的意见建议。最后, 应当加强对社交媒体工具的使用, 向社会大众及时更新政府开放数据计划的最新进展, 充分普及和宣传开放政府数据的相关理念和活动, 提升社会大众的关注度、参与度和支持度, 并借此与公众就相关主题展开切实有效的双向沟通。
大数据的战略意义在于“通过对海量数据的交换、整合和分析, 发展新的知识, 创造新的价值, 带来大知识、大科技、大利润和大发展”。开放政府数据以创造公共价值为最终目标, 将实现开放数据在经济、社会、政治方面的长远效益。
政府开放数据评估指标
“开放数据晴雨表” (Open Data Barometer) 由万维网基金会组织开展;“开放数据指数” (Open Data Index) 则由英国开放知识基金会 (Open Knowledge) 组织开展。这两个是得到各国政府、国际组织及国际开放数据社群广泛认可的开放政府数据评估项目。在开放数据晴雨表 (2014) 中, 中国位于第46位 (共86) , 而在开放数据指数 (2014) 中, 中国位于第57位 (共97) 。