11月@@23-24日@@,“2017互联网@@+智慧中国@@年会@@”在@@北京万寿宾馆召开@@。本届年会以@@“智绘城市@@@@ 数造未来@@”为主题@@,以数字政府@@@@、智慧城市@@@@、互联网@@+欧宝娱乐靠谱吗 、数据@@治理@@、信息社会等为主要议题@@。会议由中国社会科学院信息化研究中心@@、北京国脉互联信息顾问有限公司联合主办@@,国脉海洋信息发展有限公司@@、浙江蟠桃会@@信息技术有限公司协办@@,共有来自全国部委@@/省@@/市@@/区县电子政务@@、智慧城市@@@@、大数据@@主管领导@@、行业专家@@、企业代表@@、主流媒体千余人参会@@。

在@@“2017政务信息系统整合共享与数据@@资产@@普查研讨会@@”上国脉海洋常务副总经理@@@@、高级咨询@@师王路燕@@@@以@@《大数据@@时代政府数据@@资产@@管理@@实践@@@@》为主题@@进行了分享@@@@。

Jfoto2607_20171123_FF1_8516.jpg

国脉海洋常务副总经理@@、高级咨询@@师王路燕@@@@

以下是会议现场发言实录@@(根据速记和录音整理@@,未经本人审核@@)

今天在@@这里跟大家分享@@国脉在@@目前政府数据@@资产@@方面的探索和实践@@,政府管理要有基础和经验@@,我结合我们做过的浙江和海南及其他地方的实际案例与大家分享@@在@@大数据@@的时代数据@@资产@@的管理实践经验@@。

一@@、大数据@@时代的讨论热点@@

首先来看一@@下大数据@@时代讨论的热点@@,大数据@@概念提出几年来@@,现在@@关于大数据@@的讨论主要从三@@个@@角度来讲@@:

第一@@个@@是大数据@@@@技术@@@@,现在@@做大数据@@@@,就要有平台@@@@、传统的数据@@仓库以及实时的计算@@,这些都要涉及到方方面面的大数据@@技术@@。政府要做新的技术@@,要做大数据@@架构@@,我们有时候会问他们@@:到底哪些数据@@@@?这些数据@@的哪些部分适合哪些技术@@?很多地方企业都没有想明白这个@@问题@@。

第二@@个@@是应用场景@@@@,这个@@图是银行给的场景@@,现在@@有这么多数据@@@@,这些数据@@到底要用在@@什么业务@@上@@?它的应用场景@@是什么@@?很多政府部门以业务@@需求为导向的做大数据@@@@,都是不切合实际的@@。

blob.png

应用场景@@

第三@@个@@是数据@@交易@@,这是最近的热词@@,以前公司都讲有金融的资产@@、人力的资产@@、物资的资产@@,但是现在@@企业都在@@想做数据@@资产@@@@,包括国内外的一@@些专家@@、研究机构都在@@探讨自身数据@@资产@@怎么进行估值@@,怎么样能够进入企业的资产负债表@@,最后能够变成实际的价值@@。同时我们梳理了一@@下@@,目前全国各地成立的数据@@交易中心@@,这里我们只是列举了一@@些@@,贵阳有两个@@@@,贵阳大数据@@交易所@@、贵阳现代农业大数据@@交易中心@@。说到数据@@交易@@,数据@@在@@交易过程中@@,它是不是真的适合被交易@@,数据@@的一@@些特性是不是符合@@?在@@数据@@的数据@@质量方面@@,哪些数据@@的量@@、数据@@资产@@被盘点清楚了@@?这些问题都没有考虑@@。  

二@@、面临的问题@@

通过对大数据@@时代热点的讨论@@,我们可以通过这些问题来进行导向@@,政府部门它的到底有哪些数据@@和系统@@?产生了哪些业务@@@@?这些数据@@系统之间@@,关系是什么样的@@?这些都是不清楚的@@。最后总结起来就是数据@@资产@@不清晰@@,数据@@价值难以体现出来@@、数据@@质量是不可控的@@、质量不高因为我们没有从底层开始做这个@@系统@@、业务@@,这些都是面临的问题@@@@。

三@@、Gartner-数据@@管理成熟度@@

这个@@图是一@@个@@国外的研究机构出的数据@@管理成熟度@@的分析@@@@,大家可以看到@@,左边是@@2016年的内容@@,右边是今年的@@。这里有一@@个@@非常有趣的现象@@,可以看到红色的那些点@@,代表还没有到达成熟期之前@@,这个@@词已经过时了@@。通过图可以看到@@,2016年有三@@个@@词过时@@,一@@个@@是大数据@@@@,一@@个@@是大数据@@@@技术@@,从侧面说明大数据@@发展这么多年里@@,现在@@这个@@词已经过时了@@@@,原先叫大数据@@@@,现在@@大数据@@是一@@个@@常态了@@,刚出来的时候觉得很难处理@@,现在@@大家顺应了这个@@趋势@@,所以说这个@@词已经过时了@@@@。

blob.png

Gartner-数据@@管理成熟度@@

2017年有两个@@红点@@,一@@个@@是数据@@目录@@,第二@@个@@也是大数据@@相关的@@,这两个@@词以后还会过时@@,这些词的成熟度反映了大家关心大数据@@未来的发展趋势和方向@@,包括现在@@重点的关注度在@@哪@@?那么我们如何解决这些问题@@?

四@@、数据@@管理体系@@-DAMA模型@@

blob.png

针对以上问题@@,我们也做了一@@些相关的研究@@,这是国内提出的数据@@知识管理体系@@,提到数据@@管理分为十个@@层面@@,从数据@@的架构管理@@、开发@@、操作到元数据@@管理@@、数据@@质量管理@@、数据@@安全管理@@、主数据@@管理@@、数据@@仓库管理@@、文档和内容管理@@,最后到数据@@治理@@@@。这十个@@层面之间的关系是什么样的@@@@?我认为基础的核心工作首先要做数据@@的架构管理@@,然后做数据@@的开发@@@@,最后进行数据@@的操作@@,任何一@@个@@数据@@从无到有@@,都要经过这三@@个@@步骤@@。得到这些数据@@后@@,这些数据@@还不能用@@,我们还要去关注数据@@的三@@项@@方案@@,这三@@个@@专项@@的方案对应的是要做下面所有的特性和核心工作@@,从数据@@治理@@角度这些都是要做的@@。

数据@@治理@@和数据@@管理这两个@@概念一@@直在@@混淆@@,数据@@治理@@具有方向性的@@,我的工作组织@@、体制机制@@、人员怎么样@@,而数据@@管理管理是一@@些具体的工作@@。

五@@、数据@@生命周期@@

这些我们可以从两个@@角度去判断@@,第一@@个@@是从空间@@的视角@@,第二@@个@@是从时间的视角@@@@。从空间@@的视角看@@,我做了一@@个@@类比@@,上面一@@张图是关于中国历史的@@,为什么中国是一@@个@@集权的国家@@?其实这跟中国历史有关@@,也跟中国的地理有关@@,因为中国以前有水患@@,黄河发水是四@@处流的@@,不管国家的边界@@、区域@@、省@@份@@,水患发起来就四@@处流@@,要有一@@个@@相对集权的体制去治理水患@@。

blob.png

数据@@生命周期@@

类比到数据@@@@,从空间@@的角度@@,数据@@从哪里来@@,经过哪些环节@@,最后到哪里去@@。从时间的视角@@,数据@@的生命周期从数据@@的规划@@、标准@@、开放@@、实施@@、维护@@,以前我们没有关注数据@@的生命周期@@,我们关注是的系统@@下面的数据@@周期@@,以前我们做系统的规划@@、分析@@、设计@@、开放@@到最后的部署上线@@,基于这个@@系统做数据@@的管理创建@@,这时候再考虑数据@@质量的问题@@,数据@@质量要求是不是符合提出的目标@@,其实这时候已经晚了@@,整个@@数据@@生命周期@@在@@规划分析@@的时候就要考虑进去@@,这是围绕数据@@生命周期@@来讲的@@。

六@@、政府数据@@管理体系@@@@

blob.png

政府数据@@管理体系@@@@

针对数据@@的生命周期@@,我们提出了政府数据@@管理体系@@@@@@。我认为最重要的有四@@个@@@@:

第一@@个@@是数据@@资产@@体系@@,如何把数据@@资产@@理清楚@@,资产不是独立的@@,要理清楚关系@@。

第二@@个@@是数据@@的标准@@体系@@,如何进行编码的标准@@@@、分类的标准@@@@、分层的标准@@@@,

第三@@是数据@@架构体系@@,基于这些标准@@如何加架构@@?如何做模型@@设计@@@@?

第四@@是数据@@服务体系@@,基于这些模型@@@@,如何做整个@@的数据@@服务@@,包括交换共享@@、数据@@应用@@。

七@@、数据@@基因@@架构体系@@

我们对应的做了整个@@数据@@基因@@的架构体系@@,包括理论上@@、概念上的数据@@需求@@,从最开始的数据@@元和政府数据@@清单的梳理做资产的管理@@,通过一@@些技术手段做数据@@的采集@@,最后形成数据@@治理@@来提升整个@@数据@@的服务@@。

关于数据@@基因@@的服务体系@@,我们围绕整个@@数据@@的体系提出了十个@@体系和九大服务@@,所有的产品都是技术加服务结合在@@一@@起做相关的工作@@。下面我讲一@@下应用案例@@@@,如何把十大系统和九大服务体现在@@案例上面的@@。

八@@、应用案例@@-数据@@资产@@管理@@

我们做贵州资产登记的时候思考了很多@@,政府数据@@资产@@是什么@@?如何定义它@@?我们做了很多的权属关系@@,数据@@资源的登记项@@包括这些清单的要素是什么@@,做了很多的梳理工作@@,梳理完之后@@,我们做了一@@张资产地图@@,以下是我们应用的实际落地的几个@@案例@@。

1.广州市@@的数据@@资产@@管理@@系统@@

广州市@@的数据@@资产@@系统时@@,我们梳理一@@级委办局@@,信息系统近@@500个@@,系统资源近@@3000项@@,数据@@字段近@@25万项@@@@,我们会选取一@@些出现频率高的@@,对它做一@@些追溯的分析@@@@,做一@@些标准@@化和实际质量的报告@@。

2. 深圳气象局做元数据@@的标准@@体系@@

深圳气象局做元数据@@的标准@@体系@@,包括数据@@资产@@地图和气象领域目录的分类@@。

3.浙江省@@信息系统普查@@

我们给浙江省@@做了全省@@的信息系统普查@@,普查了近@@1000多个@@系统@@。然后对这些系统普查之后@@,做了一@@个@@诊断@@,系统填报上来的清单有个@@自动诊断的功能@@,根据相应的条件进行设置@@,比如说孤岛系统@@,我们要定义什么是孤岛系统@@,按照量化去设计@@@@;比如业务@@专网@@,跟其他网络不能通的@@,肯定是孤岛@@。这个@@系统中跟其他系统没有关联的是一@@个@@孤岛系统@@。我们扫描识别没有上云的@@、访问程度低的@@,日@@均少于@@1000的系统@@,这些条件设置好以后@@,系统自动会出一@@个@@诊断报告@@,告诉你这个@@系统要达到什么标签@@@@,这是在@@浙江省@@在@@做的政务信息系统@@。

数据@@目录梳理@@,我们做了很多地方的案例@@。这是我们目前梳理的一@@个@@主要路径@@,首先从我的应用系统@@,我们现在@@的系统@@导向以应用为导向@@,就是引用系统里面有哪些数据@@@@,这些数据@@采用的结构是什么@@,这个@@表结构可以通过采集的方式@@,只要部门提供给你系统的用户名和访问的网址和密码@@,你都可以把表结构提取过来@@,可以形成相应的数据@@资源目录@@。

这个@@目录不是说表结构里面是怎么样就怎么样@@,是要进行分层分级分类@@。对数据@@进行分层分级分类以后@@,就形成了一@@个@@数据@@目录@@,基于这个@@数据@@目录上@@,我们提出了一@@个@@概念叫做目录梳理的流程即未来相应的所有部门@@,要去创建它的表或者修改它的表@@,它的路口一@@定要在@@这个@@目录系统的路口@@,去生成相应的数据@@的库表@@,把数据@@库表结构导入前置系统中@@,然后部门再推送相应的数据@@@@。

我们也在@@海南省@@做这一@@块相应的工作@@,包括跟国家层面的系统@@对接@@,包括淮安我们做了@@80个@@部门的对接@@。

后面一@@个@@案例是大家比较关心的@@,我们做到业务@@层面的浙江省@@的数据@@供需对接的案例@@,浙江省@@提出了几个@@概念@@,第一@@个@@是数据@@项@@@@,数据@@项@@是我的证照@@、表格@@、结构化类的数据@@@@,然后由这些数据@@项@@组成了相应的数据@@@@,数据@@是在@@针对这些事项@@需要的材料@@,比如证照@@、批文@@,这些统称所需要的数据@@@@。事项@@数据@@串是说事项@@要实现@@"跑一@@次@@@@",它涉及的数据@@集有些是可以自行填写的@@,有可能是部门内部共享的@@,有可能是我形成一@@个@@事项@@数据@@串@@。到我的事项@@@@,我对这个@@事项@@的解析非常清楚@@,我的这些事项@@要实现@@"跑一@@次@@@@",这些材料涉及到哪些数据@@项@@@@,数据@@项@@是如何打通的@@?

相对应的数据@@共享的业务@@应用系统分为两种部门@@,一@@个@@是需求部门@@,一@@个@@是数源部门@@。需求部门可以对事项@@去串需求@@,然后对数源部门去进行相关数源的确认@@,然后我们现在@@梳理了省@@级单位前@@100项@@,包括形成一@@个@@后续对接的情况@@。

具体在@@做的过程中@@,我们还做了一@@项@@工作是数据@@标准@@化的工作@@。我们发现部门的需求是各种各样的@@,比如说一@@个@@证照@@、营业执照@@、营业执照@@副本@@、营业执照@@正本@@、印业执照复印件@@、工商营业执照@@@@、港商企业法人营业执照@@@@,其实这代表的都是一@@个@@营业执照@@@@,那么怎么样进行规范化@@?我们做了一@@个@@技术数据@@字段标准@@@@,就是数源部门确认后就会加到这个@@标准@@里面@@。下一@@次@@需求部门提出来的时候@@,在@@这个@@标准@@词里面会自动匹配过去@@。需求部门去提相应的需求@@,提了一@@个@@需求以后@@,这个@@需求就会对应的发送给这个@@数源部门@@,数源部门登录这个@@系统@@,他就会来进行确认@@,这个@@数据@@字段提出的需求@@,是不是数源@@?如果是@@,它要确认@@,要确认这个@@数据@@是哪个@@材料@@?是哪个@@业务@@系统@@?哪个@@事项@@产生的@@?它的来源是什么@@?然后我们根据数源部门提供的形成这个@@数据@@责任表@@。当然也可以说不是数源@@,我们把这类数据@@进行系统派发@@,部门来进行命名@@,到底哪个@@部门才是权威的数源部门@@,这是支撑@@"最多跑一@@次@@@@@@"一@@体化@@欧宝娱乐靠谱吗 平台@@梳理好之后@@,通过共享平台@@@@实现真正能够实现一@@次@@去办理@@。有些字段可以通过共享@@,不需要再重复填写@@,材料不需要重复提交@@。

很多地方说@@,真正实现只要去一@@次@@或者两次@@@@,很多前提是这些材料的代提@@,最难的是你如何做好这些材料的收集@@。浙江省@@做的工作是不要重复提交材料的@@,就是通过减材料这些环节@@。

这是非常完善的一@@个@@体系@@,前面是一@@个@@需求体系@@,后面是完善的共享体系@@,如何通过部门的需求清单@@,相应的需求提出来以后@@,把责任清单的数据@@归集到数据@@资源中心@@,最后通过共享接口获得想要的数据@@@@。

政府从@@2007年就在@@做数据@@共享这件事情@@,为什么做了十几年@@,到现在@@为止还是在@@做@@?我们分析@@了一@@下@@,有几个@@问题@@:

第一@@个@@是数据@@的形式@@,之前许多的资源目录和交换平台@@@@、共享平台@@@@,有许多数据@@在@@上面@@,梳理出来的数据@@哪些部门真的看得懂@@、用得上@@,这些数据@@到底是不是真正发挥了价值@@?我经常看到部门报数据@@说@@,报送量是多少@@,在@@这其中它到底发挥了哪些价值@@。

第二@@个@@是管理模式@@,如何实现可持续的数据@@共享体系@@?我们在@@做浙江省@@项@@目时提出了一@@个@@概念叫做数据@@的共享@@,你要有一@@个@@共享需求@@,这个@@需求一@@定要与部门相关@@、能够立即用的@@,一@@定要有一@@个@@完善的共享体系@@,整个@@共享平台@@@@一@@定是非常健全的@@,最后形成整个@@数据@@之间的流动@@,归集起来就是能够使数据@@真正的活下来@@、用起来@@。

我们是理念@@+实际操作相结合的公司@@,包括我们自己对数据@@本质的理解@@,对政府做了这么多年咨询@@工作的经验总结@@,对政府业务@@的逻辑@@,以及我们自己对数据@@的落地实施@@案例@@,今天的分享@@主要到这里@@,谢谢大家@@。

演讲@@PPT下载@@:大数据@@时代政府数据@@资产@@管理@@实践@@@@.pdf

责任编辑@@:lihui