摘要:针对目前大数据治理研究仍局限于从单一学科视角和单一层面进行讨论,缺少对大数据治理体系构建的体系化研究的现状,采用多学科综合集成方法,通过系统文献调研及案例研究的方法,将宏观、中观与微观3个层次的体系构成要素进行了有机融合,提出了宏观层面的多元主体合作联盟共治、中观层面的多层次活动流程联通共生、微观层面的多维度要素联结共赢的大数据治理体系框架及其实现的有效路径,对促进大数据治理体系构成要素的互联、互通、互动,产生整体性、成套性和针对性效用,具有理论意义和实践价值。

  1 引言

  政府大数据是政府在履职过程中产生或获得的海量数据集、数据流、融合数据和链接数据。随着信息技术的突飞猛进和政府部门信息化工作的持续推进,政府部门积累的数据呈爆发式增长。在我国,超过80%的数据资源掌握在各级政府部门手里,但并未得到有效利用,故而难以实现数据驱动的政府治理创新。解决数据有效利用的问题涉及利益相关方的多种需求及多样化的实现路径,需要从多学科视角建立一套科学的大数据治理体系。本文基于对135个政府数据资源形成机构、保管机构、利用服务机构和技术服务支持机构的调查,提出了政府大数据治理面临的挑战和构建大数据治理体系的必要性;基于对大数据治理体系构建的代表性文献内容的文本分析,提出了政府大数据治理体系构建必备要素的基本构想;基于贵州省大数据实践的案例分析,探索了政府大数据治理体系及构成要素实现的有效路径。

  2 政府大数据治理面临的机遇与挑战

  在大数据时代,数据的影响已经渗透到经济、社会、生活的方方面面,数据对经济发展方式、社会治理模式、民众行为方式产生了深刻影响,使人们对政府治理规则产生了新的认识。当前,世界各国都在尝试打造适应信息化新阶段和新要求的数字政府,而我国政府具备率先在世界上建设数字政府的基础和条件。通过探索,形成“数据上浮、共享汇聚、服务下沉、按需高效”的数字政府新模式,不仅可以提高政府的办事效率,也能通过数据分析实现政府决策的最优化和精准化,推动服务型政府建设。目前,随着政府数据量的指数级增长,非结构化数据类型日益增多,数据权属日益复杂和难以界定,潜在的安全和隐私风险威胁日益严重,政府大数据治理面临以下新的机遇和挑战。

  ● 就数据本身而言,政府数据资源的形态从以结构化为主转向以非结构化为主,从以离线静态数据为主转向以在线动态、实时数据为主,从线下转向线上线下融合,从单一转向多样。数据的价值从对政府专用转向对企业、社会和个人多样化用户需求满足,从信息单向传递转向多向增值再用,从单一价值实现转向多元价值实现。数据资源的战略地位从电子政务转向“智慧城市+”“互联网+”“区块链+”“大数据+”等新兴技术和数据驱动的应用场景,从对组织层的价值转向行业层、地域层、国家层、国际层竞争优势,从国家转向“一带一路”等国际性竞争优势。数据权由简变繁,并具有不确定性,涉及信息主体的所有权、删除或留存处置权、利用权、授权他人利用的许可和审批权、隐私保护权等,甚至涉及国家数据主权议题等。

  ● 就数据管理主体而言,管理主体要从数据的控制者和监管者转变为数据权利的协调者和社会协同治理的服务者,成为未来发展方向的引领者和奉献者,要具有强烈的使命感与责任感,从追求部门局部利益转向追求政府整体效益及社会利益最大化,从关注部门内外利益转向多利益相关方共同体利益最大化,从“信息孤岛”转向跨领域、跨地域、跨层级、跨系统、跨部门、跨业务的信息资源协同管理与创新服务。多元主体整合、融合、协同互动,需多利益相关方合作联盟与跨学科复合型人才支持。

  ● 就数据管理活动过程而言,政府数据资源的采集从单一来源转向多源异构,从基于目标的局部采集转向基于场景的全面采集、全域和全网覆盖、全程和全景监管,从行业条条与地域块块各自为政转向打破条块分割,走向国家统一大数据资源体系建设。数据存储从分布式、冷备份存储转向热备份、云端存储,从可信数字存储转向可信区块链平台存储。数据利用从部门内转向跨地域、跨层级、跨系统、跨部门、跨业务共享,从个别部门的数据公开转向政府数据集和数据流的整体开放,从互联、互通转向互信、互认、互动。数据维护从生命周期分段维护转向全生命周期、全流程、全要素、全数据综合集成管理,数字生态环境维护,互联网+数字治理。

  ● 就数据管理风险而言,政府数据质量、个人隐私保护和信息安全从静态可控转向动态复杂且难以控制。一方面,政府社会管理更加精细化和公共服务更加精准化对政府数据治理能力提出了更高的要求;另一方面,由于与数据开放与个人信息保护相关的国家法律法规不健全,大数据和人工智能技术算法缺少人文关怀和个人信息利用合法性管控规则,碎片化信息再次利用可能造成个人信息泄露和国家安全泄密,对社会发展构成威胁。

  3 政府大数据治理体系的构成框架

  近年来,国内外对大数据治理的研究不断增多,但对大数据治理是什么、为什么进行大数据治理和如何开展大数据治理存在不同认识,多为单一学科视角研究,宏观、中观、微观3个层面相互割裂,并各自为政。在宏观层面,主要从多维度考虑大数据治理活动的要素及其关系,构建概念体系和体系框架;在中观层面,主要从某一维度考虑大数据治理的整体解决方案;在微观层面,主要从某一要素角度考虑应对策略、程序和行动。从整体来看,关于大数据治理体系的研究多局限于大数据治理的某个层面和某几个议题,从多学科视角覆盖宏观、中观、微观3个层次的大数据治理体系研究较少,尚缺少面向“三融五跨”(技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门和跨业务的协同管理和服务)国家战略需求的针对性研究,亟待开展跨组织边界多个层面和多个议题间关系及其关联的多学科视角融合研究和体系化研究。正如梅宏院士明确指出的一样,现在的大数据治理体系还有很多不足,大数据治理概念的使用相对还是比较狭义的。

  安小米等人基于协同创新理论,研究了构建跨部门、跨行业、跨领域的协同创新生态治理体系,并从宏观、中观、微观3个层面提出了主体联盟、过程联通、要素联接的政府大数据治理规则体系。随后,安小米等人通过对大数据治理体系构建的相关文献进行系统性研究,从客体、活动、目标3个维度,对大数据治理的核心概念、动议、策略和实现路径进行了梳理,构建出基于“核心概念-动议-实现路径”三位一体的大数据治理体系概念框架,为分析政府大数据治理体系构成要素提供了分析工具,明确了大数据治理体系框架的构成要素和基本要求,为促进利益相关方达成共识和有效交流提供了支撑。

  针对目前对大数据治理的理解有多种认识的现状,基于前期研究成果,笔者提出融合宏观、中观、微观3个层次的一体化大数据综合治理体系框架构想。该框架构想覆盖宏观层顶层设计要素、中观层实施方案和微观层落地操作规范三方面要素,为案例研究提供了分析框架。

  3.1 宏观层顶层设计要素

  概念体系和体系框架是构成大数据治理宏观层顶层设计的两个基本要素。

  (1)概念体系

  概念体系主要由明确目标、权力层次、治理对象和解决问题4个部分组成 。

  ● 大数据治理的目标是实现大数据价值的最大化以及风险的最小化。这是因为通过建立可持续的治理体系,可以达到“实现价值”和“管控风险”的大数据治理目标。

  ● 大数据的权属主要包括拥有、使用、收益和处置4种,因此,大数据治理是一个识别大数据资产所有权层次的过程 。

  ● 大数据治理对象是为了保证权、责、利相关方而引入的广义上的数据治理决策机制,同时考虑激励与约束机制以及监督机制。

  ● 通过建立可持续的具有反馈和控制责任链的治理体系,在实际应用过程中解决相关决策问题。

  (2)体系框架

  体系框架涉及制定战略方针、建立组织架构和明确职责分工等要素,为实现大数据治理和大数据全程管理提供了一整套解决方案。其关键问题是识别关键性领域和数据利益相关方。关键性领域包括战略、组织、大数据质量、大数据生命周期、大数据安全隐私与合规、大数据架构;数据利益相关方涉及大数据利益相关者、大数据治理委员会、大数据管理者、数据专家。基于对关键性领域和数据利益相关方的识别,构建出一系列包括战略方针、制度规范、组织构架、标准体系、执行流程等在内的大数据治理决策保障体系,有助于实现提供创新性大数据服务和商业与社会可持续价值最大化的大数据治理目标。

  3.2 中观层实施方案

  安小米等人指出,中观层大数据治理的实施方案表现在3个层面:第一个层面为管理机制,包括业务驱动和数据驱动两种视角;第二个层面为信息治理计划;第三个层面为数据全面质量管理的部署。

  (1)大数据管理机制

  大数据治理通过业务驱动对元数据和主数据进行管理,保证数据的完整性、一致性以及准确性,实现大数据治理的策略。这一视角为机构层有效管理元数据和主数据,并实现数据业务价值提供了一套规范化管理的路径。潘永花根据《促进大数据发展行动纲要》提出了数据驱动的大数据管理机制。作为数据治理的行动依据和基本指导方针,这一视角为实现法治、廉洁、创新和服务的新型政府提供了可持续的管理治理模式,为政府部门提升治理能力提供了有效路径。

  (2)信息治理计划

  Malik P把大数据治理定义为快速发现大量的结构化和非结构化数据,对其进行收集、运行、分析、存储和处置,并且保证这些数据的安全、隐私以及成本效益的过程,这个过程包括新兴的管理方法、技术、流程和实践。Soares S认为大数据治理应该采用广义的信息治理框架,协调多个政府职能部门的目标及其与大数据优化、隐私和货币商业化相关的策略。程广明则认为在制定信息治理框架时,大数据治理可以被模型化为人和组织、策略、能力的三维构架。

  (3)数据全面质量管理的部署

  大数据治理全面质量管理包括对数据的可获得性、可用性、完整性和安全性的全生命周期和全面质量管理,尤其关注数据形成时的真实性、可靠性、完整性和可用性,使用数据时的可信性、安全性、可追溯性、可关联性、可发现性和可再用性。

  3.3 微观层落地操作规范

  微观层面落地操作规范包括三方面要求:治理主体要求、治理客体要求、治理工具要求。

  在微观层,大数据治理的落地操作规范及实现工具包括3个层面。第一个层面为具体的数据生命期的经济有效管理策略和程序,包括组织结构上的实践、操作上的实践和相关的实践。组织结构上的实践主要是识别出数据归属权、拥有者及其角色和责任;操作上的实践主要是组织执行数据治理的手段;相关的实践涉及改善政策有效性和用户需求之间的联系。第二个层面为数据质量的测评和管护,包括可用性、精确性、完整性、一致性、实效性、单值性。第三个层面为技术工具的应用及大数据治理的行动,涉及5个重要因素,包括以关注人为基础的治理理念、以政府为主体的治理主体、以多种数据为客体的治理客体、以法律和计算机等软硬件为主的治理工具、以对大数据价值为主要发掘对象的治理目标。

  4 贵州省大数据治理体系

  选择贵州省大数据治理体系开展案例分析是具有地方典型示范意义的,其大数据治理的多个“全国率先”为其赢得了发展先机,大数据治理成效显著。贵州省是全国首个国家级大数据综合试验区、大数据产业发展集聚区、大数据产业技术创新实验区,率先探索地方大数据立法,出台了《贵州省大数据发展应用促进条例》,建成了首个全国数据集聚、共享和开放的系统平台——“云上贵州”。经过近几年的探索创新,贵州省在政府大数据治理方面,以实现政务信息资源“聚通用”为目标,逐步形成了“以国家综合试验区为中心,以提升政府在经济及公共服务等领域的综合治理能力为目标,以大数据基础设施及技术布局为抓手”的综合治理格局。“谈大数据必谈贵州,谈贵州必谈大数据”已成为社会共识。2018年,在省级政府中国开放数林指数与排名中,贵州省位居全国第二,仅次于上海市;在地市级政府(含副省级)开放数林指数与排名中,贵阳市名列第一。在2018年《政府网络透明度指数评估报告》中,贵州省位居31个参评省(直辖市、自治区)的首位。

  4.1 贵州省大数据建设现状

  (1)贵州省大数据综合治理体系初步形成

  通过采用文本内容聚类分析的方法,笔者从治理层级、治理领域、治理对象、治理目标、治理效用和治理特点6个维度,对收集汇总的63份省、市级政策标准文件进行了分析,发现贵州省大数据综合治理体系建设已初具规模。在宏观层体系框架上,贵州省采用规划、计划、方案、意见等治理工具引导共治和善治,具有多维度特点;在中观层体系框架上,贵州省采用条例和办法等治理工具提供法治管控依据,具有成套性特点;在微观层,贵州省采用技术标准和指南治理工具指导互联、互通、互动精治目标的实现,具有针对性特点。整体而言,贵州省大数据综合治理体系建设初具规模,在宏观层体系框架上有善治和共治规划、计划、方案引导,在中观层体系框架上有法治条例、办法、意见、通知运行管控,在微观层技术实现上有精治标准和指南指导。贵州省与大数据治理相关的文件情况见表1。

  (2)涵盖宏观、中观、微观层面的治理机制基本成为共识

  通过对贵阳市大数据发展管理委员会、贵州省大数据发展管理局、云上贵州大数据产业发展有限公司、贵阳块数据城市建设有限公司等7家主要大数据单位进行实地调研,笔者发现7家单位在治理机制方面具有一定的共识。从宏观层来看,创新机制为动力机制,资源配置机制、服务机制、信息安全保障机制、应急机制为协同创新机制;从微观层来看,信息共享机制和信息技术工具机制为约束机制。但从中观层来看,各单位在运行机制和保障机制方面还未完全达成共识,治理机制有待进一步建立健全。

  4.2 贵州政府大数据综合治理体系建设的经验借鉴

  贵州省通过几年的政府大数据治理探索创新,初步形成了集宏观、中观、微观于一体的大数据治理模式。在宏观层,通过多元主体的协同形成了共治模式;在中观层,通过多维活动的联通形成了法治模式;在微观层,通过多级要素融合,形成了精治模式。

  (1)共治模式——共治

  通过全省动员的“云长制”成套性配套方案,解决多元主体共治互联的难点问题。贵州省通过建立“云长制”多元主体互联原则,发布《全面深化推进“云长制”工作方案》《省人民政府办公厅关于全面推行“云长制”的通知》《“云工程”成效考核工作方案》等有效治理工具,为解决“数据资源谁来建”的治理体系构建的主体互联难点问题提供了有地方贡献的方案。

  (2)法治模式——共生

  通过数据资产化管理条例、信息跨部门/跨业务共享办法、调度契约合同机制等成套的法规依据,解决多样信息服务互通的痛点问题。贵州省通过建立多元数据价值实现互通规则,发布《贵州省政府数据资产管理登记暂行办法》《贵州省政务信息数据采集应用暂行办法》,通过贵阳市先行示范《贵阳市政府数据资源管理办法》《贵阳市政府数据共享开放条例》《贵阳市政府数据共享开放实施办法》《贵阳市大数据安全管理条例》《贵阳市政府数据共享开放考核暂行办法》等有效治理依据,为解决“数据资源从何来”的大数据治理体系构建的数据互通痛点问题提供了有地方特色的方案和法律支持。

  (3)精治模式——共赢

  通过“聚汇通”管道的针对性的标准规范,解决条块分割问题,实现信息块的融合、互联、互通、互操作。贵州省通过建立“聚通用”多维度要素互动方案和标准规范,发布《贵州政府数据“聚通用”攻坚会战实施方案》《贵州省发展农业大数据助推脱贫攻击三年方案(2017—2019年)》《“云上贵州”平台应用规范指南》《云上贵州数据共享交换平台接口规范》《云上贵州系统平台使用管理规范》《贵州省政府数据共享交换与应用管理规范》《贵州省大数据清洗加工规范》《电子证照批文库共享应用规范》《政务信息资源目录编制指南》等有效治理规范,为解决“数据资源如何用”的大数据治理体系构建要素互动问题提供了有地方亮点的可操作性方案。

  一系列大数据领域的政策实施,从宏观、中观、微观3个层面为贵州省大数据发展提供了有力保障,解决了不发达地区发展大数据普遍遇到的机制不畅、人才匮乏、资金短缺、产业基础薄弱等问题,促进了数据的共享开放、确权流通及开发利用。数据显示,贵州省大数据企业从2013年的不足1 000家增长至8 000余家,大数据产业规模总量超过1 100亿元,2017年贵州省数字经济增速37.2%,位列中国第一。2018年,贵阳市大数据企业主营业务收入突破1 000亿元,较2017年增长22%,大数据与实体经济融合指数达到45.3,全市政务应用系统全部接入“云上贵州”贵阳市分平台,政府数据全部实现共享交换,全市政府数据开放平台累计面向社会免费开放618万余条数据,为企业和个人开展政府数据资源社会化开发利用提供了数据支撑。

  4.3 贵州省大数据治理存在的问题及突破口

  尽管贵州省已构建了一套较为有效的政府大数据治理体系,但仍存在一些问题亟待改进,比如:数据资源数字连续性管理的战略意识亟待纳入顶层设计;覆盖数据资源全生命周期信息活动的全程性管理规划有待进一步健全;数据资源跨领域、跨地域、跨层级、跨系统、跨部门、跨业务的统筹规划、协同管理和创新服务有待进一步完善;对可信数据资源长期保存和管理维护及可持续再用的准则亟待制定;在政府数据资源共享、开放及利用中的个人数据保护分级分类规则亟待建立健全。

  未来,贵州省在深入实施大数据战略行动、加快建设国家大数据综合试验区时,需持续建立健全其宏观、中观、微观一体化融合的治理体系,着力突破5个瓶颈:一是不断提高数据管理程度;二是努力破解数据流通不畅、融合共享难的问题;三是整体提升政府大数据的应用水平;四是加快补齐人才匮乏短板;五是进一步建立健全共享规则及管理机制。

  5 结束语

  政府大数据治理体系建构存在于宏观、中观与微观不同视角。本文采用综合集成方法,融合多学科视角和多个层面、多利益相关方需求,充分利用文献研究成果、实地调研访谈等多种信息,把宏观、中观与微观3个层次的体系构成要素进行有机融合,构建出政府大数据治理体系的框架。该框架在宏观层上,有利于以制度安排体现多元主体的合作联盟共治,在大数据治理的核心概念和体系框架上达成一致;在中观层上,以业务规则促进多层次、多向度的活动流程联通共生,形成统一共享、开放、利用等的全生命期治理的机制和规则;在微观层上,有利于技术标准规范促进多维度的要素联结共赢,提供联动的治理程序和实现工具。该框架与贵州省大数据治理实践相映射,得到了实践验证,可以作为梳理地方政府大数据治理成功经验和有效实现路径的分析框架,同时还可以作为发现其治理实践中存在的不足的一种评测基准。

  作者简介

  安小米(1965- ),女,博士,中国人民大学信息资源管理学院教授,主要研究方向为政府信息资源管理与知识管理、智慧城市及其数据治理、大数据与人工智能应用场景下的数据治理。

  郭明军(1978- ),男,中国人民大学信息资源管理学院博士生,主要研究方向为政府信息资源管理与大数据治理协同创新。

  洪学海(1967- ),男,博士,中国科学院计算技术研究所研究员,主要研究方向为智慧城市、大数据、信息服务计算、云计算、高性能计算。

  魏玮(1988- ),男,中国人民大学信息资源管理学院博士生,主要研究方向为智慧城市大数据治理与知识管理。

责任编辑:qinpeng