信息技术浪潮推动着我们进入了快速发展和不断创新的时代,乐观者说这是一个伟大的时代。然而我们也面临巨大的挑战和机遇,无论是“互联网+”行动,还是“中国制造2025”计划,乃至于我们要从互联网大国变为强国,最终实现中国梦的宏伟目标,都要求和驱使着我们要不断去思考、实践和创新。
数据只是客观世界的记录,正如涂子沛所说,若要最终为人类所利用,必须要经历不断的萃取、提炼和升华的过程,使之成为信息,成为知识。由此产生的工业经济、互联网经济乃至信息经济,最终都会成为人类所处阶段卓越的生产力,这样说来,数据是资源,一种不同于化石资源的人类社会未来需要依赖的资源,对于这种资源的发掘和应用,将使我们的生活变得更加美好,毋庸置疑的是,我们已经由IT时代进入到DT(数据时代)。
一、新形势的要求助推地方政府进入数据时代
地方政府面临严峻的治理挑战,肩负着经济、民生和社会发展重担,“胸怀”伟大时代的历史使命,不论发达与否、愿意与否,新形势的要求助推地方政府进入数据时代。
地方政府面临的新形势可从内、外两个角度来观察,地方政府治理的“内因”主要表现为法治政府、透明政府、服务型政府建设的目标和要求,驱使地方政府不断强化信息技术在政府管理和公共服务中的应用,“用数据说话”已经成为许多地方政府领导的共识和工作习惯,但用“鲜活”的数据去解决问题、预测分析则是地方政府电子政务面临的共同难题。
地方政府面临的“外势”,主要表现为伴随着信息技术突飞猛进的发展,政府的服务对象发生了深刻的变化,市民年龄、结构和素质的变化,以及对于政府服务内容、服务形式、频度、服务质量以及个性化等的要求,都使得各级政府部门的传统服务面临严峻挑战。这些“外势”倒逼政府进行改革,电子政务建设也开始从控制为主的IT时代向以互联网民主为主要特征的DT(数据时代)迈进。
地方政府是国家治理的基本单元,也是电子政务“条块结合”的“块数据”的基本载体和集合。“块数据”是贵阳市和大数据战略重点实验室提出的概念,将一个物理空间或行政区域形成的涉及人、事、物的各类数据的总和称为块数据的定义,非常适合地方政府的数据认知和建设思路。“条强横弱”是地方政府电子政务建设的短板,应用“块数据”概念,地方政府建立类似于计算机主板的“块数据”平台和机制,汇聚条线数据,真正让地方政府的“块数据”能够为推动产业升级、服务改善民生、推进城市转型和倒逼政府改革做出贡献。
二、数据时代地方政府的数据意识
进入数据时代,地方政府需要积极转变观念和意识,应具备以下但不局限于此的意识。
(一)数据思维和互联网思维
明略数据的吴明辉认为,通过量化的数据解决问题,就是所谓的数据思维。数据思维有个重要的前提就是首先要了解所要解决的问题。地方政府需要转变意识,用数据思维去解决政务管理和政务服务过程中遇到的问题,由此导致电子政务的建设重心由硬件建设、软件建设转变为数据建设。
电子政务建设需要向企业信息化和电子商务学习,尤其是对于互联网思维的理解和灵活运用,互联网思维中的用户、简约、极致、迭代、社会化、平台、流量以及跨界等理念和观点,对电子政务建设具有良好的启发和指导作用。
(二)政务数据即服务
在数据时代,对于坐拥海量数据资源的地方政府而言,理应让政务数据资源发挥更大的作用,产生更大的价值,政务数据即服务是数据时代地方政府所应具有的数据意识。
政务数据即服务,也为地方政府的服务职能赋予新的内容,服务型政府的理念已经深入人心。在数据时代,将政府掌握的大量数据,在法律允许公开的范畴内向社会和公众开放,是新型服务型政府建设的重要内容之一。
分层服务理念是云计算架构的重要特征之一,政务数据即服务也对电子政务架构产生深远的影响,是电子政务架构设计所应遵循的规则。
(三)政务数据的资产观
数据是数据时代中如同土地、空气和水资源等一样的资源,政府掌握了80%的数据,是各类组织中最大的数据源和信息源。政府的治理过程也是数据和信息产生的过程,积累和沉淀下来的数据可以转变为重要的数据资产。孙傲冰在《政府“大数据资产”的所有权、管理权和开发权》中定义的数据资产是指企业、自然人、国家拥有或者控制的能以价值或有用性来计量或判断的数据资源的总和,包括各种数据库系统、文件系统和应用系统等所能管理的所有数据。根据资产的权属关系,可以分为企业数据资产、个人数据资产和政府数据资产。对于企业和个人的数据资产,应依法予以保护。对于政府数据资产,则明确数据的所有权归国家所有,管理权可由各级地方政府行使,开发权可适当地进行开放,允许相关电子政务和数据服务企业加入。
数据资产与实物资产具有相似性,具有确定的生命周期属性,数据资产具有价值属性,其价值需要在数据的应用和流通中体现。数据资产的使用同样需要进行管理和盘活,盘活政府存量数据资产,使之能为政府治理和公众的信息消费做出贡献也是地方政府在数据时代的主要任务。
并非所有的数据都可以变为资产,如企业数据变为资产通常必须满足以下条件:被企业拥有和控制;能够作为无形资产,使用无形资产计量规则来计量;能为企业带来经济利益。
将数据变为资产,意味着资产变现与交易的实现,还意味着资产的保值与增值。在数据的使用过程中,要注意数据的安全,还要防止数据的盗用、滥用和数据资产的流失。
(四)政务数据的大数据观
狭义的大数据是指无法使用传统流程或工具在合理的时间和成本内处理或分析的信息。大数据的产生源于云计算、物联网和移动互联网的快速发展,地方政府所能感知到的大数据大多来源于物联网设备采集的数据和互联网获取的数据。地方政府面对大数据的“汹涌而来”之势,容易迷失方向,感到恐惧,无所适从,或为功利厂商所误导,产生浮躁,误以为大数据应用能够一劳永逸地解决传统电子政务中的痼疾和顽症。其实,大数据只是数据积累发展的一个自然阶段,是数据思维的延伸和发展,政府部门的大数据应用也大多是信息驱动型大数据应用,它与传统的统计数据处理的目标是一致的,都是要从数据中提取信息供决策使用,都是面向人脑用户的大数据应用,只不过需要一些新的工具和方法应用进来。因此,地方政府毋需恐惧,也不宜浮躁。
政务大数据并不适合大决策,大数据的长处是对具体业务进行改进,擅长解决的是小问题而不是大决策,它只对业务管理已经走上正轨的部门有所帮助,对于管理不善的部门无能为力。
大数据的大容量、多样性、速度快、真实性以及价值等特征,说明它并不是什么新生事物,而是在面对传统数据激增到一定规模后,突破传统处理手段后引发的关于如何对待、处理这类数据的思考、手段和应用。此外,基于管理视角,大数据具有复杂性、决策有用性、高速增长性、价值稀疏性、可重复开采性、功能多样性等特征,也深刻地揭示了政务大数据是数据时代地方政府电子政务建设的必由之路,对于大数据的开发是一种能力,而且是数据时代地方政府必须具备的能力。
三、地方政府电子政务数据规划思路的要点
进入数据时代的地方政府电子政务建设应以数据建设为中心,因地制宜,结合本地区的信息化现状,制定适合的数据规划与建设策略。对于多数地方政府而言,传统政务应用积累和沉淀下来的“小数据”将和新出现的政务大数据在一段时期内长期共存,“用好现有小数据,适应未来大数据,共同建成块数据”应是地方政府电子政务数据规划的主要目标。面临新的形势,地方政府在进行电子政务数据规划,乃至于电子政务总体规划时,还应理解和掌握以下规划思路上的要点。
(一)电子政务顶层设计中应有数据治理的内容
政府治理的最终目标是“善治”,需要应用信息技术实现电子治理,而电子治理的基础是数据治理。数据时代的地方政府,需要积极将政府治理的目标逐步落实到数据治理中。参照企业数据治理的定义,电子政务数据治理可定义为:在政府范围内,通过对政策、流程、标准、技术和人员的职能协调和定义,将数据作为政府资产管理,从而实现政府主数据的统一化和标准化;实现对政府范围数据的全面管理;实现对政府数据准确性、一致性、安全性、及时性和可用性等的有效管控;以及实现政府数据的可控增长。电子政务要适应新形势的发展要求,无论是依法治国理念的贯彻,还是简政放权的改革,还是大众创业、万众创新的激发,都对地方政府的信息化建设和数据治理提出更高要求。因此,在电子政务顶层设计中必须要有数据治理的规划和设计内容。
地方政府的电子政务数据规划首先应明确地表达政府及部门对数据治理的态度,制订相应的数据治理参考模型。该参考模型要充分结合组织、业务和技术的要素,从了解数据、清理数据、数据转换与加工到交付数据,从元数据贯穿全程的运用,到定义业务问题、业务成熟度的评估,从确定治理的实施路线,到数据治理结果的度量,从数据来源及责任的明确、划分,到数据隐私、风险、安全管理角色的设立,从包括主数据在内的数据了解,到自动化流程的协作机制的建立,既为数据时代的电子政务的建设指明方向,也是地方政府盘活存量数据资产,进而从数据资产中获取价值的必要途径。
(二)政务数据的责任域划分
有别于电子商务和企业信息化,政务数据具有鲜明的责任域特征。在现阶段条件下,地方政府的业务仍旧由地方政府政务管理和政务服务两类事务组成,政务管理以政府传统内部事务管理为主,政务服务则是以面向公众提供公共服务为主,政务管理与政务服务相辅相成。
将数据从政府部门的层级提高到政务管理和政务服务是一个进步。笔者并不认同不加区分的数据一体化,它忽视了政府部门的实情,也忽视了电子政务建设的现状。政务管理和政务服务两个责任域的划分,也是基于数据生命周期的考虑,更加符合互联网思维的要求。
划分后的政务服务领域中数据的权属关系变得明晰,地方政府公共服务过程中获取到的个人、企业相关的数据,在正式提交给政府部门之前,数据的属主仍是个人和企业,只有正式提交给政府部门后,才真正意义上成为政府采集获取到的数据。如此,将公共服务领域中一直以来困扰服务部门和服务对象的关于数据的权属和责任的问题就迎刃而解。
政务管理领域的数据属于政府部门,其中包含政府部门依法通过物理设备采集到的用于公共服务和公共决策的数据。政府部门具有保护政务管理领域数据合法、合理使用的责任和义务,政务管理领域数据统一归地方政府而非某个部门所有,这从根本上打破了部门数据垄断的藩篱。
政务管理和政务服务领域的数据责任不同,数据应用对象和目标也会有所不同,为进一步配合部门责任清单的梳理工作奠定基础。数据虽然按照责任域进行了划分,但数据是活水,通过平台、流程、接口流动起来,在面向公众的整体政府建设的过程中,数据横贯政务服务和政务管理两个责任域,既能保证政府面向公众服务的一体化、完整性和高效率,又能兼顾到政府部门职能的差异和责任的分担。
(三)数据驱动下的电子政务架构需要创新和发展
传统电子政务总体架构的设计仍旧以应用、系统平台作为重点,显然不适应数据驱动下的电子政务总体架构的设计要求。数据驱动下的电子政务总体架构,需要围绕数据这个中心,更多地关注数据的生命周期,更应从数据视图来对待应用的需求和资源的需求。如前所述,在数据时代,地方政府应具有政务数据即服务的数据意识,这种意识也对地方政府的电子政务架构产生深刻影响。数据即服务隐含地包含了云计算架构的要求,间接地对地方政府迈入云计算架构提出了要求。政务数据即服务,也对数据的应用方式提出了要求。电子政务数据也必然要经历数据集成与理解、数据感知与交互、学习与认知、交易与经济等阶段。如何适应上述阶段的发展,同样也对电子政务的架构提出要求,需要不断创新和发展。
数据驱动下的创新地方政府电子政务总体架构应该是依据数据责任域划分,聚焦政务服务和政务管理两个领域,应用平台理念,逐步构建“一体双核”架构。创新电子政务架构还应该体现在对于数据质量的重视,虽然大数据不关心数据的因果关系,只关注数据的关联,但数据的真实性不高以及大量的“坏数据”更容易严重影响到数据的应用。创新电子政务架构还体现在“小数据”和“大数据”的应用结合上,通过应用多种工具和方法,利用“小数据”的精准性和“大数据”的全面性,为地方政府处理和解决具体问题,可以起到良好的辅助决策作用。有鉴于此,创新的电子政务架构既要满足传统“小数据”的采集和应用,也要满足“大数据”的处理和分析。
(四)数据治理的前提和重点是元数据管理
众所周知,元数据是关于数据的数据,然而在整理或管理元数据时,却很难将其析构并进行有效管理。Forrester Research将元数据定义为“用于描述数据、内容、业务流程、服务、业务规则以及组织信息系统的支持政策或为其提供上下文的信息”,恰如其分地满足了业务、技术以及管理等不同角色对于元数据的认知,这种方式更加适合对电子政务元数据的理解和认知。地方政府四大库(人口、法人机构、空间地理和宏观经济)和信用库的建设,依法行政、公共管理和公共服务过程的标准化建设,政务管理和政务服务流程的定义和管理以及政府部门本身具有的政策贯彻、政令通行等,均可反映在广义的元数据上。元数据既反映了业务的观点,又代表了技术的特征要求,还体现了操作上的记录和痕迹。本文对所述元数据的概念外延进行了扩展,元数据、元模型以及“元—元模型”等统称为元数据。
数据治理成功的关键在于元数据管理,通过元数据管理,可以管理复杂数据集成环境中的变化,交付可信、安全的数据。通过业务利益相关方参与数据治理的元数据管理,可将业务相关的元数据与技术相关的元数据关联,为地方政府的协作提供统一完整的语义信息,元数据管理的效率直接影响到管控和配置的效率。大数据应用和治理,同样离不开元数据管理。可以说,元数据管理是数据管理的基础。
(五)有效管控下的数据共享与开放
政府的数据开放与信息公开既有区别又有联系。首先,数据是对客观世界的测量和记录,而信息则是加工后的数据。其次,在开放的目的上,政府信息公开的重心在于“知”,旨在保障公众的知情权,提高政府透明度,侧重于公开信息的政治和行政意义,信息公开是政府的一种责任;而开放政府数据的重心在于“用”。第三,形式不同,政府信息公开中的内容往往是加工后的、以相对人可阅读的文件形式存在,而开放的数据则要求是机读的数据集。政府信息公开和数据开放又是紧密联系的,推进政府数据开放是政务公开工作的重要组成内容。
数据共享和业务协同一直是电子政务建设的目标。在政府尚未解决好这些问题的情形下,地方政府面临数据时代的冲击。电子政务数据共享和开放首先是在有效的管控下,这也是为了适应新形势的要求而较为有效的途径。其次,要在政府部门或电子政务范畴内实现数据共享。第三,在共享基本实现的基础上,逐步实现数据开放。数据共享和数据开放是电子政务不同发展阶段的要务。
(六)电子政务中的数据是需要运营的
数据驱动下的地方政府电子政务数据是需要长期运营的。数据生产和应用是个长期的过程,既要满足地方政府短期对于数据价值的需求预期,也要遵循数据从采集到归档或废弃的完整生命周期的“自然”规律,还要不断地实现数据总量的可控增长。地方政府数据治理成熟度的评估与考量,需要数据运营团队在数据的应用过程中度量、考核、反馈和改进。数据共享与开放需要数据运营团队按照实施路线稳步推进。此外,打破部门数据垄断藩篱、实现数据管控流程自动化、数据安全与隐私保护等,同样需要数据运营团队来保障实施。
四、新形势下地方政府电子政务数据规划
新形势下地方政府电子政务数据规划应按照自顶向下的路径,从“一体双核”的创新电子政务总体框架出发,阐述数据治理的逻辑架构及组成。
(一)业务视角的“一体双核”架构
如图1所示,地方政府整体政府建设主要按照政务管理和政务服务两个责任域进行规划和设计,采用“一体双核”的技术架构。政务服务领域可以充分借鉴互联网平台的思路,其支撑平台主要侧重于对多租户信息空间的支持,政务管理领域则是狭义的电子政务范畴,其支撑平台主要侧重于对数据集成与交换、流程服务、表单配置、移动应用支持等能力的建设。支撑平台在逻辑结构上是由能力、内核和支持环境等三部分组成。政务服务和政务管理既相互区别,又相互联系,二者通过支撑平台连接。图1揭示了政务管理的业务组成,展现了行政执法和刑事执法两法衔接的关系,还从资产角度描述了不同权属数据的关系。本文论述的数据治理更多侧重于政务管理领域。
图1 业务视角的“一体双核”架构
(二)数据治理的逻辑架构
数据驱动下的地方政府数据治理,是地方政府电子政务建设的重要任务,也是数据时代地方政府治理的新内容。地方政府政务管理中数据治理的逻辑组成如图2所示。
图2 数据治理功能逻辑架构
数据治理架构主要由数据集成、数据处理、数据应用、数据管控及数据运营等部分组成,各组成部分主要由应用或能力单元构成,能力单元是可以复用的应用、经过抽象和提炼的功能,能力单元的宿主是支撑平台。资源化和能力化是现阶段云计算的主要形式和特征,能力适应了云计算的架构特征,也为在具体平台、技术、数据、系统架构上进行细化描述提供指导。
(三)数据治理路线图
与企业治理不同的是,政府治理的目标更加远大,更有广度和深度,影响更加深远。依法治国、依法行政以及透明公开都对地方政府的电子政务及其中的数据治理提出新的更高要求(参见图3)。
图3 面向组织的数据治理路线图
如图3所示,面向组织的数据治理路线图也体现了PDCA的“螺旋上升,持续演进”的理念,该路线图由六个步骤组成:①结合地方政府开展的“十三五”信息化规划以及国家电子政务相关政策,参照企业数据治理流程参考模型,对本地区电子政务中的数据治理现状进行评估。②在对数据治理现状进行评估的基础上,制订数据治理策略,该策略理应出现在信息化规划中,建设和实施周期应与信息化规划相匹配,在数据治理策略中,还应体现电子政务元数据的管理策略。③依据数据治理策略,从组织、人员、技术、流程、规章制度、管理办法等多个维度,建立适合本级政府使用的数据治理体系;此外,还应包括元数据、主数据、数据质量、安全与隐私等具体工作要求的内容。④与企业信息化不同的是,指标度量和绩效考核一直是电子政务的软肋,政务数据治理度量指标可在参照企业数据度量指标的基础上,运用裁剪、补充、自定义以及支持工具等方法,逐步建立和完善电子政务的数据治理度量指标。⑤数据治理过程管理是对电子政务数据生命周期过程进行监控、管理、增值的过程,在该过程中,要确保所制订的度量指标能够获得;其次,数据治理过程管理还应在面向数据应用的前提下,聚焦数据质量和数据安全。⑥数据治理结果度量,应用预先设置的度量指标,对比获取到的数据,进行科学评估,为下一轮的数据治理现状评估提供依据。
五、地方政府电子政务数据建设方向
在数据驱动的地方政府“一体双核”架构中,政务管理领域中的政务应用均需以统一的政务管理支撑平台为基础,通过应用功能开发、应用插件改造、遗留系统微服务开发与改造、可复用的应用功能的能力单元改造等方式,完成创新政务应用开发和建设。
政务数据治理架构,主要是通过数据治理类应用得以实现,其中需要解决好如下核心功能的开发和实现。
(一)政务管理支撑平台的作用
⒈政务管理支撑平台的组成
政务管理支撑平台是创新电子政务“一体双核”架构的重要组成部分,它主要包括支持环境、内核和能力等三部分。其中,支持环境既包含对应用开发、测试、运行以及维护等环境的支持,也包含了对物联网、互联网等大数据基础运行环境的支持,包括大数据基础运行环境,基于内存计算以及流计算技术框架的引入和支持。内核是基于组件、服务总线、元数据引擎、容器等技术的高可靠性、弹性收缩、具有自恢复能力的核心组件。能力是在内核之上,提供工作流、数据集成、数据交换、业务表单配置以及移动应用支持等政务支撑服务和应用能力的开放、可扩展的政务能力单元的集合。能力单元之间为松耦合关系,同层次的能力单元受相同的能力框架约束,能力框架通常由支撑框架、协议栈、工具集、接口服务以及元数据等组成,此外,能力框架具有自我恢复和弹性伸缩的能力。
⒉与数据治理的联系
政务管理支撑平台是政务管理领域的核心支撑平台,为其上的数据治理提供支撑,其中的数据整合和集成、数据处理等,既是数据治理类应用,也可经过标准化,改造为政务管理支撑平台中的能力单元,以接口服务的方式供其他政务应用调用。作为数据治理基础的元数据管理的应用,也可以能力单元的方式供其他能力单元和应用功能调用。元数据管理中的流程自动化和协作机制也是基于工作流能力单元来实现的。由此可见,政务管理支撑平台对数据治理至为重要。
(二)政务数据的来源
⒈政务数据的来源
政务数据的来源主要由政务基础信息数据库、政务管理和政务服务过程中的业务数据库、政府基于物联网依法采集的环境数据构成的物联网数据库、通过互联网及移动互联网依法获取的行政相对人的行为数据构成的互联网数据库等组成。
⒉基础信息数据库的建设和完善仍旧是电子政务的主要任务
基础信息数据库既包含以自然人基础数据库、法人基础数据库、自然资源与空间地理基础数据库和宏观经济基础数据库等组成的基础数据库;也包括政务数据资源范畴的如行政权力库等在内的政务信息资源基础数据库;还包括其他的诸如税收、金融、社会、民生、文化等领域的基础数据库。
与传统四大库建设内容不同的是,应更加强调基础数据库的建设和完善,既是其作为基础索引库存在的必要性;也是逐步弱化数据仓库和数据集市作为数据建设主要内容的过程,数据仓库及数据集市将以可选应用服务的方式作为数据治理的应用,而不会以“毕其功于一役”的传统方式作为政府电子政务的核心任务;还是适应大数据应用和大数据分析的形势要求。纵向来看,基础信息数据库的建设和完善同样包含了库、平台和门户等部分,在数据治理总体框架中,则是由众多分散的能力单元和应用组成。
(三)政务数据的集成
⒈包含大数据在内的政务数据集成
从数据整合和集成流程上可分为数据采集、数据清洗、数据转换和数据加载等步骤。在创新架构中,要求数据的采集、清洗、转换和加载都应成为能力,能够对外提供服务。从数据对象、方式上可分为传统数据集成和物联网、互联网数据采集两大类。从数据形态上,可分为结构化数据集成、半结构化数据集成以及非结构化数据的集成。
⒉数据整合和集成的能力
数据集成的能力主要体现为数据采集、清洗、转换和加载的能力,数据采集能够作为连接器连接各种数据源,采集服务具有良好的安全性,能够隔离、多线程采集,做到互不干扰,有良好的扩展性,支持分布式架构,支持云计算架构上的水平扩展。数据清洗则是对于出现的诸如拼写错误、不合法值、空值、不一致值、重复值以及不遵循引用完整性等的残缺数据、错误数据和重复数据等“脏数据”经过加工、补全、去除、修正等方式“清洗干净”,进入后续的流程。数据转换是对数据的合并、清理和整合。通过转换,可以实现不同的源数据在语义上的一致性,和数据清洗最大的区别是,数据转换并不剔除数据。数据加载是对清洗数据转换后的数据,按照预先定义好的数据仓库模型,将数据全量或增量载入事实表和维度表的过程。
(四)政务数据的处理
⒈政务数据的加工
政务数据处理包含了数据加工、标签、画像、多维、聚合等多种方式和操作。数据加工是在清洗后的数据基础上,为提高数据质量,方便数据的应用,对数据进行加工处理,形成高附加值的增值数据服务的必要步骤。数据标签是基于业务需求,通过数据分析和挖掘,为分析对象添加一系列可以表达其特征的指标。画像常指用户画像,是大数据常见应用,通过用户数据标签的集合来勾勒和刻画用户的主要特征。数据多维和聚合是常见OLAP的概念和功能,根据多个维度指标,构建多维的矩阵立方体,分析人员通过基于维度的数据集市快速探索和分析数据。聚合则是根据维度进行数据聚类合并的过程。
⒉政务数据的交换
政务数据处理的另一个常用功能或主要能力是数据交换,数据共享与交换是电子政务建设过程的主要工作内容。创新电子政务架构赋予数据交换精细化管理的功能,数据交换可分为直接交换和安全交换。对于不敏感可共享的数据,通过原始数据直接交换;对于敏感不可共享的数据,采用数据加密以及数据需求方代码审核和输出结果表审核双重保障等方式,保证提供方数据的可用不可见。
(五)政务数据的管控
⒈政务数据管控的意义
政务数据管控是地方政府根据自身职能对数据管控的实践,也体现了按照数据生命周期进行的数据资产化的重要思路,还是对数据的使用状况进行监控和管理,确保数据安全的责任承诺和兑现。政府数据共享与开放是有效管控下的共享与开放,数据管控也是数据治理的重要内容。
⒉政务数据管控能力组成
政务数据管控主要由数据的存储、数据质量、数据运维、数据监控、数据度量以及数据安全等组成。其中:①数据管控既要满足“小数据”的存储,也要满足“大数据”的存储,既可采用集中式,也可应用分布式存储,数据存储更大程度上体现出的是选择和配置的能力。②数据运维需要和数据运营界定工作范围,应用标准规范,依托自动化工具,完成日常维护工作,保障数据治理应用的稳定运行。③数据监控是通过构建政务信息单一视图,并在此基础上通过事件管理、仪表盘、统计报告以及数据分析与洞察等方式,能够反映完整信息供应链(信息供应链是由普华永道分析员提出的适用于企业信息化的概念)上的数据流动和相关组件的运行状况,确保日常数据生产、加工、使用过程能够正常运行。信息供应链是与传统的供应链(称为物理供应链PSC)平行,以数据报告、合规性检察、风控以及辅助决策等为目标,突破传统供应链中信息流为物流服务的限制,更加重视供应链节点数据的质量和价值,并可基于信息供应链优化企业供应链的数据驱动的价值链研究方法。④数据安全是数据管控的手段,也是数据管控的目标。政务管理中的数据保密、政务服务中的个人隐私数据等都对数据管控的安全体系构建提出要求。⑤数据质量是用来提高数据的准确性、一致性和完整性,给予大数据质量足够的关注和重视,不关心大数据质量,误以为以量取胜、以全取胜,只会降低数据可信度,影响数据分析的结果。数据质量覆盖完整的信息供应链,基于元数据,通过列分析、主键分析、外键分析、跨域分析、基准分析、数据降噪、置信区间确定以及运用数据规则和指标等,对数据标准化、匹配度、存活力以及价值度进行长期的质量监控。数据质量管理工作机制和流程的建立,质量基线的控制,也是数据质量管理的主要工作内容。
(六)政务数据应用
政务数据应用是在数据处理的基础上,通过接口服务的调用,实现政务数据的应用和决策分析。从应用范围角度,包括所有的政务内部应用和面向公众服务的外部应用;从数据应用的形态看,包括了应用程序和能力单元。数据应用程序又可细分为类SaaS的政务数据应用软件和独立的应用程序和功能,将数据应用的部分功能“优化、抽象”为能力单元,以接口服务的方式为其他政务应用、公众服务平台提供应用和分析的支持,最终实现应用即服务、分析即服务,体现了政务数据即服务的价值。
(七)政务数据运营
政务数据是需要运营的,具体而言,它是为了体现数据的价值而进行的一系列数据推广、部门和服务对象的协调、开展日常运营活动、运维的保障以及相关绩效考核的行为和机制。政务数据的协调侧重于政府部门之间的横向联系、沟通和保障,政务数据的推广则面向政府服务部门以及作为服务对象的公众,依托政府信息公开门户和服务门户,并在此基础上逐步建立本级政府的数据开放门户,对公众、社会、企业提供数据服务,实现数据增值。政务数据的绩效考核短期主要面向政府内部部门之间的绩效考量,远期则面向整个信息供应链和数据价值链的所有节点的个人和组织。数据运营也对电子政务工作提出新的要求,逐步改变单纯系统建设运维的传统工作模式,通过对运营团队、机制、流程的建设,逐步引入社会力量,运用公私合作关系PPP模式,实现数据在政府与社会之间的合理流动,产生新的商业价值。
(八)元数据管理
数据治理的基础是元数据管理,元数据贯穿了上述数据操作的所有环节,是数据治理中真正的“影子”成员。参照企业数据治理规划,电子政务中的元数据通常分为业务元数据、技术元数据和操作元数据等三类。业务元数据主要包括电子政务领域内的业务规则、业务模型、流程定义和术语等,行政权力电子监察中的监察项以及效能绩效考评中的指标、权力清单和责任清单项目等均属于业务元数据的范畴。技术元数据则是用来定义信息供应链组成部分的元数据结构,包括各种数据对象、结构、属性、依赖性以及计算方法和运算规则等。操作元数据则是指应用程序的运行信息及操作的日志等记录。
元数据管理同样遵循自上而下的实施路线,地方政府首先要在数据治理规划中明确元数据管理策略,建立元数据管理体系结构,应用基于模型驱动(MDA)、遵循公共仓库元模型(CWM)标准的元数据集成架构,实施元数据管理,完成日常数据监控,度量数据治理成果并进行评估和反馈。
在整个电子政务框架中,元数据管理是一项重要的能力,它在数据治理中无处不在,又自成体系,从存储到可视化管理,都具有相应的功能和能力,此外,它也适应了大数据时代的要求。各级地方政府的电子政务建设者需要给予元数据充分的重视,并可从以下方面建设、发展和完善:①了解数据和连接数据;②元数据的存储和读取独立于其他数据,需要由专门的引擎负责执行;③包含政务业务术语及规则在内的业务词汇库的建立和管理;④基于CWM的中央共享元数据库的建立和完善;⑤由业务部门来管理和维护的业务元数据平台;⑥通过元数据统一管理和维护平台可对所有的元数据进行浏览、管理、维护,并为用户提供信息供应链全程的数据流报告、数据血缘和依赖性分析;⑦提供包括客户端、接口、服务以及开发包等多种访问元数据的方法。
(九)数据资源目录体系的建设
数据资源目录是数据共享和开放的基础,也是基于元数据管理的基础应用,是数据共享和开放的前提,还是开展数据运营的基础条件。数据资源目录的管理对象是政务领域中的数据资源。正如“并非所有的数据都能归为资产”一样,数据资源目录中管理的也并非是数据的全集,而是出于主题应用、决策分析、共享交换、安全管控、数据开放以及其他确定目的而需要管理的数据资源。数据资源目录体系是用近似于目录的方式,基于元数据管理提供的能力,对电子政务领域的数据资源按照类似目录的方式进行管理。与传统数据资源目录或政务信息资源目录管理方式不同的是,创新电子政务架构中的数据资源目录体系的建立首先要充分借鉴互联网平台的经验,采用“工具+平台+政策、标准规范+运营”的方式,由运营团队和业务部门共同构建和管理。平台需要在目录内容编目、资源注册、发布、查询、资源发现与定位、资源维护以及资源审计和安全管控等方面提供自动化的能力。此外,对于目录的管理,可支持多种管理维度,引入标签概念,可为不同的数据资源项“贴上”用于不同目的的标签,便于归类和快速检索,将标签技术与传统的层次型目录结合使用,可实现对数据资源目录的有效管理。
结语
进入数据时代的地方政府面临新形势的挑战,这些要求伴随着新概念的宣传纷涌而至,强调以数据为中心的数据规划和建设,并不是说政府治理的中心内容是数据,而应在任何时候都将其仅仅作为治理的手段和依据。此外,这些新概念也是相通的,“互联网+”最为核心的特征是数据化,数据的共享与开放促进了分享经济的产生,分享经济又是信息经济的重要组成部分。政府为了实现“善治”目标,不断调整其与社会、市场之间的关系,行政审批改革、透明政府、法治政府和服务型政府的建设是政府为实现目标而进行的自发的改革,电子政务是改革依赖的新型有效载体,在此基础之上的数据规划和建设,包括数据生产、应用、共享和开放的数据供给可被看作是供给侧改革内容的有效补充。政府信息化正是通过柔性的信息技术、流动的数据之水,沿着经过业务流程重组的流程管道,仿佛血液流经整个刚性上层建筑的机体,使得政府治理更加健康和谐。
本文刊载于《电子政务》2016年第11期。作者简介:
霍小军,男,苏州工业园区计算机信息中心高级工程师,研究方向:电子政务、云计算、IT治理等。
袁飚,男,苏州工业园区计算机信息中心主任、高级工程师。
舒春燕,女,就职于诺基亚网络苏州有限公司,研究方向:工业数据获取与分析、SAP实施和应用、企业数据治理等。