一@@、背景介绍@@

  2015年以@@来@@,国务院相继下发@@《关于促进云计算创新发展培育信息产业新业态的意见@@》、《促进大数据@@发展行动纲要@@》和@@《推进@@“互联网@@+欧宝娱乐靠谱吗 ” 开展信息惠民试点实施方案@@》等文件后@@@@,我国政务@@信息化发展从共享交换时代进入大数据@@时代@@。

  近年来@@,我国在@@大数据@@发展方面持续发力@@,取得了明显成效@@。但也要看到@@,目前我国大数据@@发展还存在@@@@“孤岛化@@”“碎片化@@”等问题@@,无序参与过度与创新参与不足并存@@,导致大数据@@资源配置统筹不力@@,部门间缺乏有效互动@@,开放的大数据@@平台@@缺失@@,大数据@@的应有作用尚未充分发挥出来@@。

  某省委@@、省政府@@把大数据@@发展作为@@推动政府@@治理和@@公共服务能力现代化@@、促进经济社会转型升级的重要抓手@@,根据@@《某省大数据@@发展行动计划@@》,在@@“十三@@五@@”期间@@,某省将进一@@步加强信息基础设施建设@@,拓展互联网@@与经济社会各领域融合的广度和@@深度@@,以@@“数聚善政@@、数聚兴业@@、数聚惠民@@”为@@目标@@,着力加强大数据@@技术攻关@@,完善相关法规制度和@@标准体系@@,推动政府@@数据@@资源整合和@@开放共享@@,规范和@@深化大数据@@应用体系@@,强化大数据@@安全保障@@,切实使大数据@@成为@@经济社会可持续发展的辅助决策重要因素@@。

  目前某省政府@@@@70多个省级部门拥有和@@管理的数据@@@@,如典型的公安@@、交通@@、医疗@@、卫生@@、就业@@、社保@@、地理@@、文化@@、教育@@、科技@@、环境@@、金融@@、统计@@、气象等数据@@@@,呈现数量巨大@@、结构复杂@@、类型众多等特点@@。但各部门却各自为@@战@@、独立建设@@,即使在@@省级部门内部也是垂直和@@水平并存@@,无法有效支撑某省政府@@@@“群众办事百项堵点疏解行动@@”和@@实现@@@@“一@@网通办@@”的信息化建设目标@@@@。各部门数据@@问题主要突出表现在@@以@@下几个方面@@:

  1)各部门信息化差异大@@

  • 信息化程度差@@,老旧数据@@多@@

  • 各部门信息系统建设自成一@@体@@,数据@@融合困难@@

  2)缺乏统一@@数据@@标准@@,无细化技术规范@@@@

  • 数据@@格式五花八门@@,信息获取困难@@

  • 数据@@模型差异大@@

  • 同样的数据@@往往有多个来源@@@@,缺乏准确的数据@@识别和@@指标定义@@,造成数据@@口径不一@@致@@,统计@@指标差异大@@

  3)数据@@保护主义严重@@,数据@@资源分散@@

  • 受到部门利益以@@及相关法律@@、法规与行政管理体制等约束@@,各部门对各自业务数据@@有很强的保护意识@@,各局委办自成一@@体@@,信息孤岛情况严重@@

  • 数据@@资源分散@@在@@不同部门的业务系统中@@,没有实现@@资源有效的汇集整合@@,更难以@@实现@@整合数据@@价值点挖掘@@,支撑决策分析@@

  4)数据@@权限设定难@@,数据@@安全风险大@@

  • 数据@@所有者理解难@@,导致数据@@审批流程难以@@确认@@

  • 数据@@汇集后@@@@,无端到端的安全保证@@

  二@@、建设目标@@

  随着@@“互联网@@+欧宝娱乐靠谱吗 ”进程的进一@@步推进@@@@,要求政府@@建立部门间协同机制@@,打破部门利益垄断@@,加强部门间的数据@@整合@@,实现@@政府@@部门间的信息共享与交换@@,强化数据@@资源社会开发利用@@,推动跨行业@@、跨地区的信息共享和@@业务协同@@,真正做到@@“用数据@@说话@@、用数据@@决策@@、用数据@@管理@@、用数据@@创新@@”,实现@@“数聚善政@@、数聚兴业@@、数聚惠民@@”的大数据@@发展目标@@。

  政务@@主数据@@管理立足于对政务@@信息化的深刻理解@@,依托于成熟@@、先进的主数据@@管理解决方案@@,全面梳理识别出全省范围内的主数据@@@@,建立起有某省特色的主数据@@管理体系@@,为@@政府@@职能转变@@升级@@,打造透明@@、阳光@@、责任政府@@@@,以@@及响应国家层面的政务@@大数据@@@@公开和@@数据@@驱动创新创业的大格局保驾护航@@。具体建设目标@@主要包含以@@下几个方面@@:

  1)制定统一@@的数据@@标准@@,技术规范@@

  严格遵循数据@@标准规范@@,在@@数据@@治理@@过程中@@,稽核数据@@质量@@,针对问题数据@@形成数据@@工单@@,下发数据@@提供者@@,不断提升提供者提交的数据@@规范性@@

  2)实现@@政务@@数据@@@@资源共享@@

  • 打破信息孤岛@@,变@@“群众跑腿@@”为@@“信息跑路@@”,变@@“群众来回跑@@”为@@“部门协同办@@”,变@@被动服务为@@主动服务@@,快速实现@@政府@@部门间跨地区@@、跨层级的信息共享@@,强化业务协同应用@@

  • 数据@@集中管理@@,支撑智慧城市@@智慧跨部门业务开展@@

  • 公共数据@@统一@@开放@@,促进信用@@、交通@@、医疗@@卫生@@和@@档案等各类民生保障服务建设@@

  3)丰富的政务@@应用@@

  利用数据@@开展大数据@@分析@@,辅助政府@@在@@政府@@治理@@、服务民生和@@产业发展等方面做智慧决策@@

  4)立体的安全保障@@

  数据@@管理安全@@:统一@@管理策略融入数据@@流@@;在@@端到端数据@@处理过程中@@,从数据@@归集@@,数据@@治理@@,数据@@共享与服务@@,每个环节都需要嵌入数据@@安全管控和@@数据@@安全策略的执行@@

  数据@@隐私保护@@:基于用户授权@@、白名单@@(敏感用户@@)提供差异化的隐私策略@@;结合用户权限控制@@、应用权限控制@@,提供细粒度数据@@访问控制及隐私处理策略@@;提供多种去隐私处理能力@@,满足不同业务应用的需要@@:实时流处理@@、批处理@@、人机交互处理@@;提供覆盖整个数据@@生命周期的隐私保护@@

  数据@@开放安全@@:数据@@资源安全分级@@、开放策略制定@@、数据@@授权机制以@@及安全合规@@

  5)安全分析@@

  职能监测@@、威胁预测@@、智能响应以@@及安全态势分析@@

  三@@、建设方案@@

  1、主数据@@建设框架@@

  某省主数据@@管理建设方案@@框架主要包含主数据@@识别@@和@@采集@@@@、主数据@@清洗和@@转换@@@@、基础库建设@@和@@服务@@及数据@@标准管理@@、元数据@@管理@@、数据@@质量管理等几部分内容@@,如下图所示@@:

某省主数据@@管理建设方案@@示意图@@

  2、主数据@@识别@@和@@采集@@

  2.1主数据@@识别@@、标准化@@

  现阶段以@@国务院@@“群众办事百项堵点疏解行动@@”和@@《省级部门共享需求表@@》为@@目标@@,以@@“急用先行@@、重点优先@@”原则进行主数据@@识别@@@@,优先梳理出目前最迫切的和@@自然人@@@@、法人相关的主数据@@数据@@项@@,初步识别出某省政务@@主数据@@@@,如下表所示@@:

某省政务@@主数据@@示例@@1

某省政务@@主数据@@示例@@2

  通过@@对某省主数据@@进行识别@@,对业务主数据@@来源@@进行了标准化@@@@:

自然人@@基本信息血缘关系@@

  在@@此基础上@@@@,依据某省政务@@活动的需要@@,编制某省自然人@@@@、社会法人基础库的数据@@元标准和@@通用代码标准@@,以@@规范自然人@@@@、法人主数据@@管理工作的开展@@,具体规范材料如下图所示@@@@:

政务@@大数据@@@@数据@@元规范材料@@

  2.2主数据@@采集@@

  按照对主数据@@的共享的时效性要求@@,可采用以@@下两种方案@@:

  非实时主数据@@@@@@:对于共享实时性要求不高的主数据@@@@(如股权出质@@、行政处罚等@@),通过@@“政务@@共享交换平台@@@@”+“ETL”实现@@数据@@采集@@

  实时主数据@@@@:对于共享实时性要求高的主数据@@@@(如个人基本信息@@、法人基本信息等@@),通过@@CDC、触发器等方式直接从数据@@源采集@@

  3、主数据@@清洗和@@转换@@@@

  3.1非实时数据@@@@@@

  对于非实时数据@@@@@@@@,首先进入归集库@@,在@@归集库中存放和@@原始数据@@一@@致的镜像@@。归集库的数据@@需通过@@一@@定的清洗@@(如剔重@@、过滤无效数据@@等@@)和@@转换@@(如代码@@、数据@@格式转换等@@)后@@,形成符合技术和@@业务标准的数据@@进入中心库@@,以@@作为@@省大数据@@中心对外共享开放的最原始数据@@@@,清洗和@@转换@@可通过@@@@@@ETL工具实现@@@@。

  3.2实时数据@@@@

  实时数据@@@@因其低延时的要求@@,需使用实时流数据@@处理方法进行数据@@的清洗和@@转换@@后@@@@,直接进入中心库@@,实现@@的技术包括@@:Kafka+Flink。

  4、基础库建设@@和@@服务@@

  4.1基础库建设@@

  政府@@数据@@来源@@广@@、共享需求大@@,如果对数据@@只做识别@@、集成@@、质量管控等操作@@,无法实现@@主数据@@的高效@@、高质共享@@。例如个人基本信息@@分别来自公安@@、民政@@、人社等机构@@,如果只是把这几个部门的数据@@分别集中到省中心@@,当共享个人的基本信息时@@,则需在@@共享时进行多表关联@@、剔重等操作@@,影响共享的效率@@,并增加了@@API开发的难度@@。因此@@,需依据业务需求@@,对采集来的主数据@@进行逻辑数据@@模型设计@@、整合打通数据@@@@,来减少数据@@冗余@@、提高数据@@的访问效率@@。下图为@@法人逻辑数据@@模型示例@@@@。

法人逻辑数据@@模型示例@@

  4.2数据@@服务@@

  自然人@@和@@法人基础库的数据@@@@,可通过@@@@API接口@@的方式对外提供服务@@。API网关可提供@@API快速开发和@@部署@@、负载均衡@@、流量控制@@、接口@@日志@@、接口@@服务质量管理等功能@@。各委办局使用统一@@的接口@@协议和@@数据@@标准进行自然人@@@@、法人主数据@@的访问@@。

  5、数据@@治理@@

  某省政务@@数据@@@@治理目标主要包含以@@下几个方面@@:

  • 建立全省统一@@的自然人@@@@、法人库数据@@标准@@,并进行统一@@的管理@@、维护和@@查询引用@@

  • 通过@@数据@@质量管理系统落实数据@@标准的落地@@,持续推进@@全省主数据@@数据@@质量的改进@@

  • 通过@@元数据@@管理@@为@@主数据@@管理的各个数据@@处理阶段提供数据@@标准@@、数据@@映射关系和@@数据@@规则的描述@@,保障主数据@@管理的数据@@质量@@

  6、解决方案关键点@@

  因政府@@的特殊性@@,某省政府@@主数据@@管理与其它行业的主数据@@管理@@,存在@@许多的差异@@。在@@某省政府@@主数据@@管理解决方案中@@,针对某省的特点@@,因地制宜地采取了对应的措施@@。

  6.1获取正确的主数据@@@@

  某省政府@@自然人@@@@、法人主数据@@分散在@@省厅局@@、市委办局和@@区县等各级机构@@,各级机构都有自然人@@@@、法人的部分或全部数据@@@@,但普遍存在@@各机构数据@@不一@@致@@、冲突的问题@@,数据@@来源@@有库表@@、接口@@、文件等@@。为@@解决这些难点@@,采取了以@@下几个措施@@:

  • 坚决推行@@“一@@数一@@源@@”,对于每一@@项主数据@@@@,依据各级机构的行政职能和@@业务属性来准确识别数据@@来源@@@@。发生数据@@不一@@致@@、冲突时@@,以@@数据@@源的数据@@为@@准@@(如自然人@@基本信息@@:自然人@@的身份证@@、姓名@@、性别等数据@@来源@@于公安@@;婚姻@@来源@@于民政@@@@;学历@@、教育@@信息来源@@于教育@@部门@@)

  • 对于省垂直的系统@@,优先从省厅局获取数据@@@@,地市数据@@作为@@参考@@,对于地市水平的系统@@,优先从地市获取数据@@@@,省厅局数据@@作为@@参考@@

  • 在@@“一@@数一@@源@@”基础上@@,使用上下级机构或平行机构的数据@@和@@数源单位进行主数据@@的交叉核对@@,以@@提高自然人@@@@、法人主数据@@的及时性@@、准确性@@

  • 优先获取库表类型的数据@@@@,对于文件@@,在@@省中心内部转换为@@库表数据@@@@,接口@@主要用于关键数据@@项的核对@@(如通过@@民政@@厅的婚姻@@接口@@对自然人@@的婚姻@@状态进行核对@@)

  6.2问题数据@@溯源@@、闭环@@

  自然人@@、法人主数据@@对外用于社会公众@@、法人的政务@@活动@@,对内用于政府@@的辅助决策@@,如果数据@@本身出了问题@@,会造成不好的社会影响@@,同时还会带来政府@@公信力下降等不利的后@@果@@。在@@自然人@@@@、法人主数据@@管理过程中@@,需及时识别出数据@@的质量问题@@,并及时对问题进行过滤@@、溯源和@@修正@@。对发现的问题数据@@通过@@共享交换平台@@传回数源单位@@,同时通过@@工单推送等方式及时知会数源单位进行问题数据@@修正@@,形成一@@个完整的问题数据@@跟踪和@@处理流程的闭环@@@@。整体流程如下图所示@@@@:

数据@@管控治理平台@@@@

  6.3共享交换集成@@@@

  采集到省大数据@@中心的数据@@@@,经质量管理规则进行数据@@质量管控后@@@@,会发现大量的问题数据@@@@,需要考虑如何在@@政府@@网络环境@@下@@,如何将这些问题数据@@返回给数据@@源机构@@。就某省项目来说@@,通过@@把数据@@质量工单@@、问题数据@@与共享交换平台@@进行了集成@@@@,依托共享交换平台@@的传输通道@@,将问题数据@@回传到数据@@源机构的前置交换区@@,方便数据@@源机构对问题数据@@进行核查@@。

  6.4单点登陆@@、工单集成@@@@

  某省政务@@信息化除主数据@@管理外@@,还涉及到共享交换@@、目录@@、共享网站@@、统一@@维护管理平台@@@@、ETL等系统@@。所有系统在@@客户侧的入口都是共享网站@@@@,因此@@主数据@@管理系统需和@@共享网站@@进行集成@@@@,通过@@共享网站@@单点登陆@@进行账号安全认证@@,并将问题数据@@工单推送到统一@@维护管理平台@@@@@@。

  6.5确保数据@@安全@@

  自然人@@、法人的许多信息涉及到个人隐私@@、商业机密等@@,在@@共享时需要高度保证数据@@的安全性@@,以@@防止非法窃听@@、信息涉密等@@,对敏感信息做了以@@下几项安全保障@@:

  事前@@:对身份证号@@、婚姻@@、个人财产等敏感信息进行梳理和@@识别@@,建立敏感信息识别模型@@

  事中@@:对敏感信息的使用做脱敏处理@@,对确需使用敏感信息@@,在@@传输过程中进行加密处理@@

  事后@@@@:数据@@服务@@对外共享数据@@时@@,对敏感信息增加数字水印@@,确保在@@数据@@涉密发生后@@@@,能追溯定位到涉密的部门@@、人员@@

责任编辑@@:hejieling