2017年12月3日-5日,第四届世界互联网大会将在浙江乌镇举行。本届大会以“发展数字经济,促进开放共享——携手共建网络空间命运共同体”为主题,邀请来自政府、国际组织、企业、技术群社和民间团体的互联网领军人物与会,围绕数字经济、前沿技术、互联网与社会、网络空间治理和交流合作等五个方面进行积极的交流与探讨。

第四届互联网大会

作为世界互联网大会前奏,由国家互联网信息办公室、科学技术部、工业和信息化部、浙江省人民政府共同主办的第四届世界互联网大会“互联网之光博览会”于12月2日率先拉开帷幕,包含BAT在内的众多一线互联网科技公司和创业创新企业齐聚参展。继去年作为“互联网+”领域代表首次亮相乌镇,今年,国脉再次受邀,就国脉数据基因、国脉数据智能门户系统(DIPS)等成果进行展览展示。

乌镇互联网国际会展中心

乌镇互联网国际会展中心

在2日上午举行的创新发布会上,受大会主办方、舟山市人民政府推荐,国脉集团总经理郑爱军发表《数据基因与政务大数据服务知识图谱》演讲,为嘉宾和代表们介绍数据基因,并与众多国内外嘉宾一起,思考和探讨知识图谱在促进政府智能化服务方面的创新应用。

国脉集团总经理郑爱军

国脉集团总经理郑爱军

以下内容为现场发言要点:

一、知识图谱重构思维方式、重塑联系力量

知识图谱,是一张由知识点相互连接而成的语义网络,是基于图的数据结构,由节点(概念或实体)和边(关系)组成,是关系最有效的表达方式,是大数据智能的前沿研究问题。

大数据时代已经到来,数据正在重塑当今时代的资源观,大数据是基于链接和关系层面,更精准地反映、认识、掌握世界,而知识图谱是大数据语义链接的基石(语义:数据的含义,只有被赋予含义的数据才能够被使用),将重构我们的思维方式、是重塑联系的力量。

以“政府”为例:由“政府”可以联想到“政务→电子政务→互联网+政务服务→浙江省‘最多跑一次’→数据基因”、“电子政务→国脉电子政务网→数据智能门户系统(DIPS)”,还能联想到“‘看得见的手’→亚当·斯密→《国富论》→经济→政治→政府”等等。通过知识图谱,对数据进行连接,有助于我们发现隐藏在数据连接背后的“故事”、甚至创造“故事”,进一步释放数据价值、提升数据资产管理能级。

二、知识图谱的发展阶段与主要特征

知识图谱的发展可归结为三个阶段:①引文分析阶段,主要特征是连接、关系、评价,核心作用是关联性、前瞻性、客观性、准确性;②结构图视阶段,特征是结构、图表、标签、推理,核心作用是系统性、逻辑性、直观性、科学性;③智能决策阶段,发展特征是数据活化、智能化、自流程化、融合化,核心作用是全面性、融合性、抽象性、创造性。

三、知识图谱促进了政府智能化服务应用

近年来,知识图谱已在多个行业有所应用,包括政务领域:①政务信息服务方面,政府网站语义搜索、人机智能问答系统提供政策咨询、投诉建议等交互服务;②政务知识库构建,比如国家安监总局的“政府垂直行业知识库”、科技部知识库等;③AI(人工智能)+政务层面,知识图谱是AI核心基础能力;④公安部门案情调查、情报分析;⑤司法部门事理图谱、辅助判案;⑥政府部门专题分析和决策研究、舆情监控等。

其中,浙江省“最多跑一次”数据串梳理项目就应用到了知识图谱,并简单介绍了浙江是如何利用知识图谱对事项串、数据项等进行关联,目前浙江省26家省级单位前100项高频事项关联的材料已有1451项,这些材料涉及很多的申报表、证照、证明、批文等,以及各种各样的自行填写、外部分享、内部分享、数源单位确认,而所有事项的确认、来源、关联都是通过国脉数据基因普查系统进行的。

四、数据基因,基于知识图谱构建数据治理能力

国脉数据基因,是基于知识图谱构建数据治理能力的一个重要平台、系统、工具,是数据管家、数据治理专家,已荣获多项软件著作权,是国脉十二年咨询的产品化,由国脉集团下属国脉海洋信息发展有限公司数据基因研发基地开发而成,具有多版本,包括政务类、通用类、教学类、平台工具类、行业应用类、标准化类等。

其中政务类数据基因,是国脉目前拥有最多最广泛应用案例的产品系列,包括十大核心产品:①数据资产登记(普查)管理系统(管资产);②政务信息资源采集系统(管数量);③信息资源编目管理系统(管目录);④数据体系标准化管理系统(管标准);⑤公共数据元(主数据)池和标签管理系统(管基因);⑥数据分析加工管理系统(数据清洗比对入库)(管质量);⑦数据治理与评估系统(管治理);⑧政务信息系统整合决策支撑工具(管整合);⑨数据供需对接与认责管理平台(管共享);⑩政务服务事项(最多跑一次)支撑管理平台(管业务)。涵盖了从数据采集、加工、清洗比对、入库、应用等数据服务生命周期。

数据基因知识图谱在政务方面的应用案例:第一个是海南省政务采集云项目,在基础目录分类过程中,对基础类、主题类、部门类等大类下属的各种类、项、目、细目组合用知识图谱的概念进行了关联, 比如针对一个市民,通过数据基因能关联到20多个相关部门和200多个要素,又如一个部门(工信厅等)下面的系统、数据库、数据表、数据字段都要进行关联;第二个是数据智能门户系统(DIPS),其基于数据基因开发,是站群集约化管理平台,可直观展现DIPS系统知识图谱以及行业知识图谱。

五、基于数据基因提供政务大数据服务

以政务数据基因为核心,国脉提供数十项政务大数据服务,主要包括以下几部分:①数据大脑:提供基于数据的顶层设计,由大数据架构支撑;②“两手抓”:一手抓方案(数据咨询),包括数据体系设计、数据治理流程设计、大数据(产业、园区、企业等)规划、第三方数据评估;一手抓软件(数据产品),包括数据基因系列产品、数据智能门户系统(DIPS)、数据治系统/工具等;③两“脚”支撑:一个是平台支撑,基于大数据资产管理平台,提供基础、主题、部门、标签、综合库等核心数据池建设;一个是管理支撑,在大数据管理方面提供标准化建设、安全制度规范、政策/课题/研究等保障体系建设。

国脉在政务服务领域积累了丰富经验,对数据本质的理解、对政府业务的把脉、对技术落地的执行,未来将继续在大数据全口径、全流程、全活化、全精准、全可视方面进行推进,在知识图谱、智能关联、数据理解等方面做进一步突破。

责任编辑:lihui