本文系国脉集团总经理、首席规划师郑爱军女士于8月2日在由国脉集团发起主办、国脉海洋信息发展有限公司和浙江蟠桃会网络技术有限公司联合承办的“2017中国(舟山)大数据科技创新高端研讨会暨国脉集团大数据产业对接会”上的演讲,内容通过现场速记和录音进行整理,如下:
我是舟山人,很愿意为舟山做点事情,公司落户舟山也已有四年。舟山在海洋方面可以做大文章,所以我今天演讲的主题是“数据基因助力舟山智慧海洋发展思考”。
一、国脉关于大数据发展的几点思考
1、大数据是生产力
刚前面几位专家提到了对大数据的认识,尤其杨董(注:国脉集团董事长杨冰之)提到了大数据的8个V特点和五个观点,我很赞同,这里给大家分享我对大数据认识的四个点:①资源观。数据正在重塑当今时代资源观,互联网是链接(信息层)和关系(价值层),大数据是更精准反映、认识和掌握世界。②认知观。人类社会进入数据时代,利用大数据改变认知事物的方法,要像资产一样去管理。③技术观。信息化从注重网络、系统到注重数据,技术更重要的是考虑数据的采集、存储、管理、分析、展现、流动、应用等方面。④价值观。数据的多少、好坏、开发利用能力的强弱已经直接影响组织运营和创新服务能力;要围绕价值挖掘应用到产业中,如风控类、安全类、监管类等,又如气象应用在雾霾天气预报等。
大数据不是越大越好,而是越有用越好,要从“资源、认知、技术、价值”全面认识大数据。大数据以海量、多维、时效的数据资产为资源基础和对象,以大数据技术为工具和手段,以价值挖掘为导向,整合数据思维、数据能力、数据价值于多元化应用的生产力系统。所以,我认为大数据是一种生产力。
2、数据治理能力正在成为组织竞争新优势
国脉一直在研究数据治理,数据治理能力正在成为组织竞争新优势。人类社会已进入数据时代,从起初的计算(处理),到链接(关系),再到数据资产,数据浪潮比想象还要迅猛。最近一段时间我们在参与浙江省公共数据普查和贵州省的一些项目,其实整体都在理清网络系统与数据的关系,尤其是数据库、数据元、数据字段的关系。注重数据,已成为当前信息化的重要视角与核心任务。
3、大数据治理的要点与难点
大数据治理的要点:①如何提炼、确保数据资源质量?这是国脉数据基因的最大魅力所在,我们说“基础不牢,地动山摇”,数据基因就是来做好基础工作;②管理能力与方式,我们管什么、怎么管?这里就考虑到统筹、规则和监督;③信息规则如何有序建立?这是各种主题参与方式的要求;④数据如何实现按需流动?这是国脉一直倡导的“数据不活化、不流动,数据就没有价值”,所以我们在数据采集、共享、开发、利用环节都要实现按需流动;⑤数据驱动服务、驱动决策如何真正实现?要考虑数据效能与价值。
数据的难点包括管理压力大、风险隐患多、效果难体现。
4、海洋数据要从构建数据治理能力入手
海洋数据未来核心竞争力是服务创新力;创新力主要表现在哪里?不是内容多少,而是服务质量和服务个性化;服务质量和个性化的关键是什么?是数据质量、信息关联度和用户画像;信息关联能力如何体现?主要要求是实现字段级共享与系统调用;如何实现字段级共享和系统调用?需要进行数据元标准化。数据元标准化的标志是什么?是标准数据元池的建立和在所有应用和服务中的流动。
这里有三个有利于,也是数据基因为什么做最底层的数据标准化、字段共享和信息关联的原因。有利于数据生产、数据共享、数据开放的事情,我们要去做,这是对数据治理的简单描述。
二、舟山海洋大数据发展思路建议
舟山该如何发展海洋大数据?首先我们要了解下海洋数据的现状:
(1)系统庞杂。系统独立建设、独立运行,缺乏全局的统一规划和顶层设计。舟山可能有1000多个系统是独立或割裂的,而我们在做广州数据资源梳理时,发现其有1万多个系统可能存在信息孤岛、信息资源没有集中。
(2)数据混杂。数据内容重复采样、数据格式、编码不统一,行业规范和标准相对滞后,缺乏底层的统一数据标准,数据间缺乏关联共享技术平台和管理机制。
(3)体量巨大。空间地理数据、船舶基础数据、位置和航行数据、气象水文数据等海洋数据本身庞大的数据量。
(4)需求多样。海洋管理、港口管理、渔业资源分析和海上事故调查分析等均需要海洋大数据的支撑,要解决在海洋数据收集、管理、应用、开放与共享存在的问题,高标准地谋划舟山市海洋大数据平台的规划设计。
在这里,我们提出了一个舟山海洋大数据的发展思路:以云计算、信息和通信、大数据挖掘、物联网和信息安全等关键技术为支撑,通过涉海资源整合与集成共享,建设集空间信息、气象水文数据、船舶基础和航行数据、海洋经济数据和行业用户数据存储、管理、挖掘和利用于一体的海洋大数据中心,形成多源信息资源目录体系,并通过打通行业壁垒和信息孤岛障碍,逐步实现区域范围内的涉海资源的全面整合,为我市海洋海岛管理、海上安全救助、海洋经济发展、海洋权益维护和社会公众提供全面、多层次的海洋数据支持和辅助决策服务。
围绕发展思路,我们提出了海洋大数据的应用架构,海洋大数据中心应包括渔业捕捞生产数据 、渔船行驶轨迹数据、海洋环境数据、气象水文数据。
那么,国脉数据基因如何在海洋大数据中心进行架构?在海基角度(基础设施一块),最大的一块是数据池和数据基因建立的数据标准化,包括数据整合、数据处理、数据挖掘、数据总线、数据共享平台等。通过数据审计到数据应用,数据应用包括数据服务(开放接口、可视化、统计分析)、决策分析(决策支持、经济分析、预警分析)、海洋服务(渔业政务、海岛航运、船舶港口)。再建立数据标准、结构标准、安全体系等。
围绕数据基因架构,我们认为要循“数”管理、序“数”服务,从四方面构建数据生态:①通过数据基因平台,统一标准的数据环境,整编基础目录数据,整理专题数据资源;②进入数据处理平台,汇聚一批数据资源,集中全域数据管理,统一传输与同步机制;③数据处理平台衍生一群服务于集约化应用平台,通过集约化应用平台孵化一批产业,形成数据产业生态;④数据产业生态会产生一堆数据,可借助数据基因平台进行整编。我们也希望通过今天的会议,集聚大数据企业,为舟山的大数据产业发展、智慧海洋做贡献。
国脉数据基因,其最大的魅力在于对国家的相关行动计划做了很大的探索。近段时间,我们在国家信息中心、贵州、江西、海南等都做了演示和试用,各领域都需要国脉数据基因。国家提出了39号文件(注:《国务院办公厅关于印发政务信息系统整合共享实施方案的通知》),其中的十件大事,数据基因均能对应:
◆“消除‘僵尸’信息系统1、部门内容信息系统整合共享2”,这个工作,浙江省和贵州省政府在做,叫数据资产登记与普查、数据元标准化与系统相关性分析。
◆“提升国家统一电子政务网络支撑能力3”,国家信息中心在做。
◆“推进接入统一数据共享交换平台4”,我们在平台方面有些部署。
◆“加快公共数据开放网站建设5、推进全国政务信息共享网站建设6”,数据智能门户系统(DIPS),正在舟山开发(注:基于数据基因研发,支持多组织、多站点、独立管理的网站群,是制作、维护网站的利器,可为网站建设与内容管理提供全面的规范的指导思想)。
◆“开展政务信息资源目录编制和信息系统数据资源全国大普查7”,国家信息中心跟我们全面对接,在国家层面形成数据资源的一张图。
◆“加快构建政务信息共享标准体系8”,这就是我们现在做数据元及分类体系标准化,从国内来说,我们的标准已成为事实标准,最多的标准在国脉。
◆“规范网上政务服务平台体系建设9”,包括“一号一窗一网”和“互联网+政务服务”,我们的王路燕(注:国脉海洋常务副总、数据基因研究中心副主任)正负责浙江省政务服务网“一数一网”的平台建设,也是用数据基因在做。
◆“开展'互联网+政务服务'试点10”,包括浙江、江西、上海徐汇区、广州、佛山等试点地区;这个叫数据服务模型设计。
数据基因的魅力无限,它是链接的世界、跨界的融合、服务的社会、结实的未来。我们要抬头看、脚踏实地做好基础工作、要有方法论,要对应政策、要有实践、学会使用工具。坚持用“工匠精神”做好信息数据资源管理应用基础性工作,用落地的“顶层设计方法”设计大数据建设一体化体系实施路径,在“新思维和新技术”环境下共性平台重构,让数据基因在决策、管理、服务方面都利用好。
最后,构建智慧海洋,形成网络善治,共建美好未来。国脉愿为舟山智慧海洋奉献时代智慧。