“产业研发也将发生变化,制造方法、材料与设计互为影响,有协同的可搜索的数据库,自动化的工作流和数据移动,研发过程不像传统的从设计到选择材料再到规划制造与供应链的顺序式研发,而是非顺序的,是以整合的形式做研发。”邬贺铨说。
数据挖掘蕴含巨大机遇
大数据在燃油节约、航空正点运行、油气管线、交通运输、商场购物等各方面都有用武之地。
目前大数据在制造业的应用已经有很多案例。美国雷神公司的工厂自动保留了每个导弹的数据,包括配件及操作员以及湿度和温度,当错误发生时,有助于找出究竟是哪一个环节的问题。陕鼓动力集团收集出厂设备的运行数据,将过去销售设备的一次性收入扩展为长期的售后服务支持,服务收入占公司收入的1/3。摩托车生产厂商哈雷公司不停记录微小的制造数据,如喷漆室风扇的速度等,当察觉速度、温度、湿度或其他变量脱离规定数据值,它就会自动调节机械。
邬贺铨说,百度也将网民对汽车的各类搜索请求进行大数据挖掘,帮助一汽等车企深入了解消费者需求,设计新品和资源调配。
数据挖掘早已有之,主要是通过各种统计分析方法、知识发现手段、可视化图形分析,发现数据间的内在联系,例如发现政府、部门网站上各种文件之间访问的相互关系,获得不同网页间关联度,便于组织站点的内容;也可以对数据分类、聚类,利用历史数据做推导和预测;可以根据数据的前后时间顺序,找到“一些项跟随另一项”的内部事务模式。
基于数据挖掘技术的大数据产业规模百倍于大数据设施产业。大数据产业的构成可以分成五个层次,从下向上来看,最底层是网络设备、存储器、服务器的设备层,其上是关系数据库、非关系数据库、数据分析软件、数据应用软件、安全软件等基础软件层;第三层是云计算、数据存储服务、数据软件的开发工具平台服务,数据分析软件平台服务,提供数据分析解决方案的服务等平台层;第四层是工业、农业、商贸、交通运输、建筑等传统产业因大数据应用而增值的部分;第五层是医疗、教育、环保等传统服务行业因大数据应用而增值的部分。大数据影响巨大,受到广泛重视,也正是因为对其他产业影响的溢出效应明显。
数据的开放与挖掘将释放全球经济增长动力。大数据可以在发动机运行监视中应用,GE在每一个引擎上装了20个传感器,在飞行过程中每隔一段时间通过卫星将传感器收集的引擎状态传给GE公司,每个引擎每小时产生20TB数据量,因此GE每天收集PB级引擎数据。GE通过对所生产的2万台喷气式引擎的数据分析,开发的算法能够提前一个月预测其维护需求,预测准确率达到70%。将发动机的处理过程从30天压缩为仅仅20分钟,目前全球有24个航空公司的340万英里航线使用GE的发动机,可每年及时发现2000次可能的缺陷。大数据在燃油节约、航空正点运行、油气管线、交通运输、风电预报、电信应用、商场购物、互联网金融、医疗设备、影视业各个方面都有用武之地,为整个产业带来巨大的机遇。