11月23-24日,“2017互联网+智慧中国年会”在北京万寿宾馆召开。本届年会以“智绘城市 数造未来”为主题,以数字政府、智慧城市、互联网+政务服务、数据治理、信息社会等为主要议题。会议由中国社会科学院信息化研究中心、北京国脉互联信息顾问有限公司联合主办,国脉海洋信息发展有限公司、浙江蟠桃会信息技术有限公司协办,共有来自全国部委/省/市/区县电子政务、智慧城市、大数据主管领导、行业专家、企业代表、主流媒体千余人参会。
在23日下午举行的“政务信息系统整合共享与数据资产普查研讨会”上,深圳市电子政务资源中心主任武刚以《深圳政务数据资源体系建设及应用探索实践》为主题进行了演讲。
深圳市电子政务资源中心主任武刚
以下是会议现场发言实录(根据速记和录音整理,未经本人审核):
今天我跟大家分享一下深圳政务数据资源体系建设及应用探索的实践经验。前面几位嘉宾讲的很到位,有国家层面的、理论实践的,我们深圳的一些做法,可能跟其他地方不太一样。今天我主要讲三个方面。
第一建立政务数据资源体系是国家电子政务建设与发展的关键因素。这些大家都有共识了,资源体系建设对电子政务的体系建设方式方法来讲,是颠覆性的一种路径。前几十年的政务系统的建设,导致的后果大家看得见。面向新的世纪,电子政务发展到一定的阶段,政务信息建设是关键的因素。
第二介绍深圳市政务数据资源体系建设的一些探索,经过几年的发展,我们做了一些工作,跟大家分享一下。
第三是体会与思考。
一、建立政务数据资源体系是国家电子政务建设与发展的关键因素
首先看一下重要性,习总书记在2016年的10月份讲到,“以数据集中和共享为途径,建设全国一体化的国家大数据中心,推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。”这是我们最高领导人关于数据的一些论述,李克强总理提到“要信息多跑路,群众少跑腿”。作为信息化的部门,如何达到目标,这是我们应该思考的问题。
从国家部委来讲,“十三五”也提出了实施国家大数据战略,推进数据资源开放共享,这是落实国家领导人的一些谈话和要求,出台了很多文件,包括《政务信息资源共享管理暂行办法》《政务信息系统整合共享实施方案》这些规范化的文件,对全国各地信息化主管部门来说都是实实在在的工作要求。
二、深圳市政务数据资源体系建设的具体实践
1.存在的问题
(1)数据烟囱林立
深圳怎么去落实国家的要求和指示?我们想跟大家分享一下。首先我们看一下导致数据资源不能共享,主要问题是什么?经过我们研究、分析发现应用系统太多,经过不完整的调查分析,深圳大概有1000多个应用系统,正是由于这些应用系统的存在,它给数据整合带来了困难。当然如果没有这1000多个系统,我们信息化发展也不能到现在这一步,信息化发展也有一个阶段,早期是各单位、各部门独立的开发和建设业务系统。到了今天是按照以数据为中心去云平台建设我们的业务系统和数据中心。
(2)数据割裂(入户办理程序)
在我们办理业务中,因为有很多业务系统,我们办一件事情要跑很多部门,花费很多天时间。例如深圳入户办理的程序,时间和天数给申请办业务的群众带来了很多不便,主要还是因为我们的数据没有跑路,我们的人在跑路,问题非常明显。
2.出办法:政务信息资源共享管理办法
深圳2006年出台了《深圳市政务信息资源共享管理暂行办法》,这在全国比较早,以后国家部门做了几个月的调研,又出台了国家的一些管理办法。这个文件是在2015年去掉了暂行,变成了真正的一个办法,即《深圳市政务信息资源共享管理办法》,对优化政务信息资源的配置起到了关键的作用。
基于对深圳市的调研,补充和完善出台了《深圳市信息资源管理目录体系》,深圳市信息共享开展的制度创新、管理创新和服务创新的这种模式,在2015年各部门进行了大胆的探索,创新服务共计617项,深圳市的信息共享工作得到了国家部委的充分肯定,获得了全国唯一的示范市城市,这是国家给予的高度评价。
3.建平台:建立数据共享平台实现数据逻辑集中
那么我们介绍一下我们的做法。在实施当中,我们第一步做了数据的逻辑集中,早期我们叫做共享交换平台,实际上解决的问题就是数据的逻辑集中问题,它不是一个物理集中数据库,这是我们在建立数据共享平台,实现数据逻辑集中的第一项任务。按照共享为原则,不共享为例外原则,建立了深圳市政务信息资源平台,目录包括61个市级单位,10个区,共4308类资源,这是共享平台的数据逻辑集中的一个安排。
数据共享平台5年变化情况
平台运行五年来,接入单位数和资源目录数大概有一个比较,从2013年到2017年,接入的单位数逐年在递增,资源目录数也在近五年发生了变化,2017年发生的变化最大。信息指标数增加最多,共享交换平台,实际上是我们对解决数据的逻辑集中的一个最重要的手段。
(1)数据融合的思路
关于数据融合的思路我们运用这个模型GLDM:跨部门跨系统跨业务(三跨)的政府通用LDM(逻辑数据模型)如图所示:
逻辑数据模型
(2)数据大融合的方法
数据大融合就是为了实现了数据实体集中的问题。如何解决数据的物理集中问题?为什么要做物理集中?其实逻辑集中这个问题没有解决数据融合问题,逻辑集中无法解决数据融合,所以我们要做一个物理集中平台,就是基于数据大融合的思路解决数据融合的问题,数据融合实际上核心是需要解决数据跑路的问题。
(3)数据大融合的框架
有一个叫做跨部门、跨系统、跨业务的政府通用数据逻辑模型,通过对源数据的清理、脱敏、达到提供开放和交易服务的目的。那么清洗数据进入资源总目录要实现物理集中,就要对源数据进行分几个步骤处理,包括原子区、集市区、贴源区、整合区、应用区,最后形成应用系统。在这个建立物理集中的时候,我们规划了对物理数据融合的一个大框架,最底下是我们的电子公共平台,中间层是数据层,数据层包括主题数据资源和业务数据资源,上面通过数据挖掘、资源共享、比对服务进行操作。
目前来讲,我们建立了几个基础库以后,实际上各个部门的需求慢慢产生,因为有了资源,大家就有了想法,有了想法就有了办法。最终通过数据开放平台和一些网站,向社会公众和政府部门提供服务。
4.深圳市公共基础信息资源库
那么看到我们具体做了几个基础的数据库,有了大平台我们的核心还是落在几个大的数据库里面,我们建立了基础信息资源库,主要是人口、法人和房屋三大类,共计148亿条精准数据,人口数据达到了1859万多,法人数据大概288万,企业数据大概有不到300万,房屋数据近83万, 房间数据1351万,还有29个部门接入,累计近148亿条数据,这是我们基础数据库的建设情况。
(1)人口基础信息资源库
我们的人口数据是通过什么方式建立的呢?实际上各部门相关人口的数据融合在一起,不仅仅是简单的公关数据,我们要实现人口数据大融合,从一个人出生到死亡的相关数据都整合在一起,构造了我们的人口基础信息库,使它具有完整性,教育部门、卫计部门、人社部门、出租屋等等这些数据都有,在每一个节点上都有相关的数据,使我们的人口数据成为一个大融合的数据,这是人口数据。
(2)法人基础信息资源库
法人数据也是一样的,从企业注册开始,到人员招聘、纳税、注册几个阶段。因为政府部门对企业也是分段管理,就像治理河流一样是分段管理,这样导致数据是分散的,通过法人基础数据库的融合,就会形成一个完整企业生命周期的完整数据。市场监管委的基本信息大概有400多万条,民政局、社团的基本信息有4000多条,企业信用中心的有40000多条。社保局提供的个人信息基本数据,公积金的基本数据还有市场监管委出的股东高管信息,这些信息都是属于企业法人库的信息。
(3)房屋基础信息资源库
房屋纳税信息出自税务局,房屋的融合数据有两条线,一条线是大楼的起建,包括套数、位置、结构,以及配置的电梯,另外从出租屋是一条线,那么我们就把这两个数据融合在一起,变成了房屋的基础信息数据库。
(4)综合监管和公共信用库
除了三个大库以外,我们还建立了数据库,印发了《深圳市综合监管和公共信用信息资源目录》及其数据标准。目录共包括74家信源单位,426项资源信息,其中综合监管占56项,公共信用占370项。这里面的问题很多,数据的所有权、使用权和公示权在哪些部门有,在法律上没有规定,例如一个单位处罚了一个驾驶员,处罚以后,驾驶员认为不合适,那个处罚单已经纳入到了信息库里,但是被处罚人到了中院起诉,你的行政过错处罚有问题,那么在这个过程当中,法院出来调解,调解以后达到的结果是,被处罚人不希望把这个数据放到信用库里,如果放到了信用库里,谁有权力把它撤掉?我们实际在操作当中法律上是空白的,在信用体系建设当中,我们面临的问题非常多,因为法律没有认可,主管部门为了减少麻烦,在信息的使用当中,尤其是涉及到当事人的时候,这些事情是非常难处理的。
(5)电子证照数据库
电子证照库也是我们在建设当中的一个技术库,目前已有120个部门进驻了我们证照系统,目前发布34个,增量同步签发26个,我们要实现全部达到电子签发,电子签发以后全面实现归级。
5.数据标准管理系统
上述我们介绍了几个主要的政务数据库的建设,那么在数据库的建设当中,我们认为数据标准的管理非常重要,必须要进行标准化的处理。
6.数据质量监测系统
还有一个是数据质量的监测,这里面是什么问题?数据质量监测是动态的,只有业主或者用户们使用你的数据,他才知道你的数据质量是不是有问题,所以要基于这个原因,我们要建一套质量监测的平台,出现了问题,通过这个平台报出来,然后去核对,这样才能使我们的数据进行动态化的优化,这是数据信息监测的重要作用。
7.政府内部数据服务--数据服务支撑平台
还有一个是数据服务支撑平台,我们要解决政府内部数据分级服务,安全可控三级等保环境向二级等保环境数据服务,它们不在统一的环境当中,要实现这些系统有障碍,要把收集的数据归集到二保级环境上,这里面我们做了数据支撑平台。
8.对社会大众的数据服务--政务数据开放平台
还有一个是政务数据开放平台,解决政府数据有序对社会开放,安全稳定向政府网络环境开放。
9.基本公共服务配置和供给管理系统
我们有了数据、平台管理系统,保证了数据的质量,下一步是用数据,实际上用数据是最困难的,以前我们做系统是基于需求来开发系统,但是我们这次做的是基于数据的大归集,然后向政府其他部门提供服务。
我们通过梳理,大概有十大服务事项和内容可以通过数据为社会提供服务。用大数据平台,我们可以规划深圳市小学学费的情况,这是一种应用。还有形成一个主动服务模式,我们查找年满65周岁老人的信息,然后联系到当事人,生日当天老人直接会收到邮件。有了数据以后,主动服务就成为了一种可能。还有深圳的社康数量的规划,由政府规划社康的布局。
积分入学应用前和应用后的例子,原来一个当事人要跑很多部门,办理积分入学,现在教育局可以直接办理,非常简单。
10.管数据:从主观的内部协调到客观的制度保障
从主观内部协调到客观的制度保障,我们也做了一些工作,是真实社会建设"有织网工程",为了保障数据质量,出台了管理办法,这是制度保障。还有房屋的编码标准,大家都知道深圳的农民房比较多,实际上每一栋房子都没有编码,很多房子都没有路牌,有大量的标准化工作要做。
三、体会与思考
最后要分享一下关于我们的一些思考,从业务角度我们实现了市级各委办局数据的大融合,提升了资源中心做为城市融合大数据支撑的能力,基于市公共信息资源库进行了二次开发应用。从服务的角度来看,我们要将数据应用与安全平衡,我们是数据的归集平台,但我们不是使用部门,我们建立了三级等保环境,使用的环境和我们不太一样,我们要解决使用的问题。
未来的话,大数据平台还要按照国家的标准和要求进行新的改造升级。对于深圳市大数据的整体发展我们会有未来五年左右的一个发展规划,包括现有云平台技术做的相关工作。
由于时间关系,我就分享到这里,谢谢各位。
演讲PPT下载:深圳市政务数据资源体系建设及应用探索实践.pdf