2017年@@6月@@11日@@,由中国新一代@@IT产业推进联盟指导@@,CIO时代@@学院@@、光明网联合主办@@,北大软件工程研究中心@@、北达软@@、政府@@采购信息报社协办@@,CIO时代@@APP承办的@@@@“第十一届中国电子政务@@高峰论坛暨@@2017中国新型智慧城市@@创新@@50强授牌@@”在京隆重举行@@。万山数据@@@@CTO、北大信息化与信息管理研究中心技术顾问@@鲁四海@@在活动中发表了题为@@《智慧城市@@中的@@大数据@@分析@@服务@@@@》的@@主题演讲@@。以下为演讲实录@@:

 

万山数据@@@@CTO、北大信息化与信息管理研究中心技术顾问@@  鲁四海@@
 
  大家下午好@@!各位专家都提到了在新型智慧城市@@建设中@@,大数据@@是非常重要的@@@@,大数据@@的@@实施落地@@,如何让数据@@产生经济效益将是智慧城市@@建设中的@@重点工作@@。
 
  先从时间维度看@@,2013、2015、2017都有说是大数据@@的@@元年@@@@,但主题词确有不同@@,2013是技术@@,2015年@@是集中@@、共享@@、开放@@,2017却是进向全面数字化@@、数据@@驱动业务创新的@@起点@@。显然智慧城市@@是大数据@@的@@主要应用领域@@。
 
  大数据@@在智慧城市@@的@@应用主要体现在四个方向@@:对于政府@@是提供决策支持@@;对于企业是监控@@@@、创新引导@@;对于市民是提供智能分析@@,实现智慧生活@@,例如通过@@智能地图出行@@;通过@@大数据@@优化城市发展与环境的@@问题@@。
 
  从技术层面看@@,智慧城市@@重要支撑是物联网@@、大数据@@技术@@。物联网解决数据@@感知和智慧化响应@@,大数据@@技术@@则是两个过程中最核心的@@过程@@,是通过@@数据@@挖掘将数据@@变成知识@@、变成决策@@、变成行动指令的@@过程@@。
 
  大数据@@之于智慧城市@@如此重要@@,那在建设过程是否也面临一些问题和挑战@@,我们团队调研发现主要有以下几个方面@@:
 
  一是数据@@安全问题制约数据@@开放@@@@;二是用户不能便捷使用数据@@进行分析@@;三是统一的@@平台@@如何满足不同部门对数据@@的@@要求@@;四是很多数据@@不是鲜活的@@@@,建设好大数据@@平台@@@@,其中很多数据@@可能是历史的@@@@。从技术视角看@@,缺少一个敏捷数据@@分析平@@。
 
  敏捷大数据@@分析@@平台@@@@,四个特点@@:
 
  第一@@,它是面向用户的@@@@。大数据@@分析@@不仅是@@IT部门或数据@@分析师的@@事情@@,它应有运营和@@BD、PR的@@参与@@。例如企业@@,可能是客服@@,政府@@是市民服务热线等服务机构@@。
 
  第二@@,一定要面向业务场景@@。在不同的@@领域@@,比如交通@@、社区服务@@,在使用过程中@@,日@@报@@、周报能够反馈过来@@。
 
  第三@@,即时计算@@。如果一个分析需要几个小时或更长时间@@,对于普通用户是完全接受不了的@@@@。
 
  第四@@,支持探索式的@@分析@@。要做到探索式的@@分析要做好三个方面的@@事情@@,一是数据@@的@@可视化@@,分析人员看到的@@数据@@是可理解的@@@@,而不是数据@@库中的@@英文字母@@;二是分析的@@可视化@@,指的@@是分析的@@过程所见即所得的@@@@;三是算法@@模型的@@可视化@@,对于业务用户@@“看得见@@”可用的@@模型@@,能简单地调用相关模型算法@@@@,然后连接自己的@@数据@@就要能实现数据@@挖掘@@。
 
  提到敏捷分析时@@,大家可能会想是不是讲敏捷@@BI。此敏捷非彼敏捷@@。最大的@@区别在于敏捷@@BI重视工具本身的@@轻便@@,即安装部署的@@轻便@@,而忽视的@@使用户的@@轻便和功能的@@丰富程度@@。所以导致很多人一说敏捷就是@@HTML5、图表@@、不建@@、直接分析等@@,敏捷的@@最终目的@@是让业务用户参与数据@@分析@@,实际上这几点解决不了这个问题@@。
 
  需要的@@未来发展的@@敏捷数据@@平台@@应该具备以下特点@@:
 
  第一@@,多数据@@源集成@@;
 
  因为大数据@@分析@@挖掘一定是广泛维度的@@数据@@才能产生它的@@价值@@。
 
  第二@@,业务化语言@@表达@@;
 
  对于分析人员@@,不是容易看懂数据@@标的@@东西@@。
 
  第三@@,未来的@@建设应是集约化的@@@@;
 
  工具平台@@是可以通用的@@@@,大部分数据@@应是共享@@的@@@@,当然也存在个性化数据@@@@。未来的@@平台@@是一种这样的@@结构@@,平台@@层应是功能上完全通用@@,能够通过@@多租户的@@技术供给不同组织使用@@。在这个过程中@@,不同的@@租户可以享受一些公共开放@@的@@数据@@@@,但也有自己配置管理的@@权限@@,这样才可达到快速发展的@@过程@@。
 
  第四@@,灵活的@@数据@@管理@@。
 
  将分散的@@数据@@快速实现逻辑集中@@,跨表@@、跨库等问题不需要分析师的@@关注@@@@,他只需要分析他所得东西@@,分析师要找到数据@@@@,然后选择合适的@@模型算法@@和可视化工具@@,快速完成分析@@。
 
  第五@@,KPI;
 
  作为一个分析平台@@@@,分析后要反映到业务过程中@@,其中很重要的@@一点是有很多的@@@@KPI,通过@@KPI监控@@,把异常即时反馈到业务过程中@@,通知到人及时做出决策@@,通知到系统及时做出反馈@@。
 
  第六@@,算法@@库@@;
 
  很多基础算法@@是通用的@@@@,只是数据@@的@@不同@@。比如环比@@、同比等@@,根据业务场景的@@特点@@,用的@@时候选择相应的@@数据@@对应可能出现的@@结果@@。
 
 
  万山数据@@@@提供的@@敏捷分析平台@@即是按这样的@@应用需求设计@@,不仅有丰富的@@功能@@,还在数据@@安全管理@@、共享@@开放@@上下了很多功夫@@,同时兼容各种数据@@分析环节中的@@事实标准@@,比如报表兼容@@Jasper、BIRT,图表@@兼容@@Hightcharts、ExtJS,数据@@挖掘完全支持@@R语言@@,还能直接集及@@TOS的@@ETL任务调度@@……
 
  最后@@,介绍一下万山数据@@@@@@,北京万山数据@@@@科技有限公司@@,核心团队由来自于著名科研机构@@、知名企业的@@大数据@@专家组成@@。是中国新新一代@@IT产业推进联盟孵化的@@首家大数据@@公司@@。我们主要提供两个方向的@@产品和服务@@:大数据@@分析@@技术与工具@@、数据@@分析服务@@。
 
  技术与工具包括大数据@@敏捷分析平台@@@@、文本数据@@的@@挖掘平台@@@@、大数据@@多屏互动系统@@,解决从数据@@集成@@、分析到交互中的@@问题@@。仅有工具是不够的@@@@,数据@@分析需要模型@@、算法@@,还需要对数据@@资源的@@全面了解@@、对数据@@质量的@@管理@@,因此我们提供了大数据@@资源规划的@@服务@@,主要解决三个问题@@,知道有什么数据@@@@,哪些数据@@是可用的@@@@,以及解决怎么用的@@问题@@。谢谢大家@@!
责任编辑@@:admin