大数据@@@@助力疫情溯源与监测@@

  总书记指出@@,要运用大数据@@@@等手段加强疫情的溯源和@@监测@@,这是@@对大数据@@@@作用的肯定@@,也是对互联网界的一个要求@@。

  手机已经成为另一张@@“身份证@@”

  现在@@手机已经成为我们个人的另一张身份证@@@@。我们在@@@@2018年@@移动通讯普及率是@@112%,而全球是@@106%,独立移动通讯用户的普及率@@,也就是说扣除了一人多号@@,我们是@@82%,接近发达国家的水平@@,移动互联网的普及率高于全球的平均水平@@。可以说@@,我们国家有独立活动能力的人群几乎都有手机@@,而且中国实行手机用户的实名制@@,从@@手机用户就可以识别持有人的身份@@。

  手机可以关联持有人的位置@@

  一般手机在@@待机的时候@@,用户会从@@一个小区移动到另一个小区@@,这个时候@@手机要不断接收基站发出的测量信号@@。读取测量信号@@,可以说@@选择新的小区@@,在@@非待机的时候实际上@@就是切换了@@。因为用户可能是在@@移动的@@,而蜂窝半径又比较密@@,因此@@,更新的时间要比较快@@。

  目前@@的更新是秒级@@,可以说@@具有实时性@@。当然@@手机是根据什么定位呢@@?主要是利用基站@@,有几种方法@@,可以基站定位@@。定位精度如果说用比较好的方法@@,定位精度可以数十米@@,一般目前@@可能是一两百米@@,5G基站更密@@,定位精度就更高@@。

  全球导航@@卫星@@+数字地图可提升定位精度@@

  当然@@,除了基站定位以外@@,我们用全球导航@@卫星@@和@@数字地图都可以定位@@。现在@@的智能手机比例已经很高了@@,能够百分之八九十@@,所以@@智能手机都装了全球导航@@卫星@@的接收的能力@@。定位的精度一般数十米@@,当然@@它更好地可以做到米级@@,但是@@室内是做不到的@@。另外@@,数字地图公司有它的一些方法来扫描这个街道@@@@,因此@@它的定位甚至@@可以到每一栋楼@@。

  一般来讲@@,手机用户如果下载@@了这种数字地图的@@APP,而且开机并启用了定位功能@@,它就会变化新的位置@@,会发送信息给@@GPS。所以@@,能知道你所在@@的位置@@。当然@@,它的定位精度比基站的方法要好得多@@。

  但是@@,只限于装有数字地图@@APP的用户@@,我们有个比较知名的数字地图公司@@,目前@@它现有用户数是@@7个亿@@(下载@@),占全国移动用户还不到一半@@,只有@@43%,所以@@说覆盖面是有限的@@。但是@@,尽管电信的运营商覆盖定位用户更多@@@@、更全面@@,但是@@精度并不一定比数字地图公司更好@@。

  这里边@@,给出的是一个数字地图公司的大数据@@@@地图@@,它可以溯源@@,武汉春节前将近@@500万人流到什么地方去@@,这里可以给出一个很好的走势@@。

  有了这些@@数据@@@@,怎么来决定疫情的传播@@?国际上通常用一种叫@@C-SEIR的模型@@。它把人群分成什么呢@@?I就是已经感染病的人群@@,E是密切接触者@@,S目前@@是健康的@@,R是最后@@运算结果是康复的@@,它有一套规律@@。

  中国的学者提出了一种改进@@,增加了@@P和@@Q,P是疑似人群@@,Q是确诊人群@@。现在@@我们国家也是分四类@@,从@@中可以计算出传播的模型@@@@。

  我们可以看到@@@@,这是@@从@@@@1月@@份到@@2月@@9日@@,全国的疫情传播模型@@。可以看到@@传播的状况@@,目前@@,中国的修正模型@@,考虑了政府的采取措施和@@大众的对于防疫的意识@@,所有上面的模型@@@@,还是基于因为城市里头感染者和@@没感染者@@,包括所有的加起来是一个常数@@,也就是说不考虑城市里面有流入的和@@流出的@@。

  实际上@@利用电信大数据@@@@@@,可以把流入流出的一部分人考虑进去@@,可以使得这个模型更精确@@。

  大数据@@@@可视化@@——“疫情方寸间@@”

  当然@@,有了模型@@,很多大数据@@@@还需要有一种可视化的表现@@。这里给出一种可视化的方式@@,每个方框表示每个省@@。比如说@@右下角的方框@@--湖北@@,它的背景颜色就比其他的深@@,也就是感染人群更多@@@@。

  其中绿色@@是治愈的@@,黑色是死亡的@@,可以看到@@治愈的比例也比其他省要少@@,死亡的比例反而还比较高@@。可以看到@@,这是@@一种直观的看法@@。

  我们有了这种行为的大数据@@@@@@,可以精确到每一个小区@@。左图是百度@@,以上海为例@@,右图是腾讯@@,以深圳为例@@,它都可以以一种@@APP的方式来发布@@,老百姓可以用@@,下载@@可以查询@@,甚至@@可以查到哪个小区的具体位置@@,距离你所在@@地方有多远@@,里面有多少个是确诊病例@@。

  实际上@@,其中一家公司说@@,已经覆盖了@@200多个城市了@@。现在@@开始复工了@@,这是@@2月@@10日@@,节后第一个复工日@@@@,人流的增加也为疫情的防控带来了一些新的压力@@。这里面给出了疫情期间城市的热力图@@,我们可以细化到每个县@@,可以让我们知道@@什么地方人最多@@,尽量避免人口的密集@@。

  这里面是一个确诊患者的行程追踪@@。从@@底下看是@@1月@@21日@@他离开武汉@@,乘坐了高铁@@,到达一个地方@@,21日@@又换了一个高铁@@,到另外@@一个地方@@,一直到@@24日@@,他发现有症状了@@,当然@@他行程还得继续@@,27日@@又到了一个地方@@,30日@@又到了下一个地方@@,31日@@确诊了@@@@。

  根据这种确诊患者的行程追溯@@,我们可以很好地知道他到过哪里@@。现在@@有些地方是依靠流行病学的调查@@,去问这个患者@@,你什么时间到什么地方@@,一个是他记不准@@,另一个说不准@@,利用手机的大数据@@@@@@,可以很好的知道@@。

  同时@@,通过计费数据@@@@,也可以知道他平时比较密切的联系人@@,也可以知道有没有可能是密切接触者@@@@。

  基于卫建委@@+交通@@+工信数据@@查找密切接触者@@

  我们把卫健委@@的数据@@@@、交通@@系统的数据@@@@、工信部门的数据@@组合起来@@,可以找出密切接触者@@。比如说@@,卫健委@@可以知道确诊患者的姓名@@、身份证@@号@@,然后通过交通@@部@@@@,可以给出这个患者半个多月@@来乘坐过的航班车次@@@@,卫健委@@让工信部提出@@,这些@@人的手机号是什么@@?根据手机号@@,地方政府可以找到密切接触者@@,当然@@这是@@从@@@@官方的查找@@。

  实际上@@平台@@也可以开放@@,同行者可以在@@同行查询平台@@查出我所坐的航班和@@车次@@@@,车上有没有确诊患者@@,可以很好地发现密切接触者@@。

  电信疫情大数据@@@@平台@@用于个人自证无疫区行程@@

  目前@@,还是返程复工@@,还有节后回家的时间@@,有些人隐瞒了自己来自疫区@@、到过疫区的经历@@,回到家@@、回到村子里头还到处走@@,虽然看上去没有症状@@,但是@@可能已经感染了@@,并且是有很强的传染性@@,导致了疫情扩散@@,导致几十人甚至@@上百人被隔离@@,或者已经被感染@@。

  通过手机定位@@,是可以知道这个用户是不是来自疫区@@,还是到过疫区@@,但是@@这种形式不能直接提供给街道@@@@、小区和@@乡镇@@,因为隐私的保护原因@@,如果我们开放给他们@@,很可能不一定是查患者@@,说不定用作其他@@,所以@@不能这样做@@。

  现在@@怎么办呢@@@@?我们知道@@,从@@《个人信息保护法@@》得知@@,本人是可以查询自己信息的@@。所以@@,工信部现在@@统筹三个运营商@@,提供了用户行程的服务@@。用户提出来@@,你可以查询你本人@@,在@@14天@@前到过什么地方@@,当时工信部提出是按停留@@4个小时以上@@,这个时候@@,你有清单@@,就可以上当地的用工单位@@、街道@@、小区来证明你自己没有到过疫区@@,这就是自证@@。

  目前@@,这件事情已经开放查询上千万人次@@了@@,当然@@现在@@面临返程复工@@,有些地方甚至@@扩大化@@,把一些疫情确诊人数比较多的省要求全部都不许人家回来@@。这实际上@@严控不能失控@@,硬核但不能乱来@@,所以@@实际上@@@@,返程的一些检查是必要的@@,当然@@就会对旅途带来一些影响@@,这里比如说@@以高德地图为例@@,他给出一个人从@@济南要到上海@@,原图的经过城市的疫情情况列出来了@@,上海市对进上海的人有什么管理及要求也列出来了@@,包括高速路入口@@、出口的车流量@@,以及大概这个过程中间有很多检查站@@,路程需要多长时间也列出@@,返程直通车也方便大家@@,如果返程的人知道@@,我路上大概要多长时间@@,要做好什么准备@@。

  电力大数据@@@@在@@疫情防控@@中的作用@@

  除了电信和@@互联网公司的大数据@@@@以外@@,事实上还有其他大数据@@@@@@。我这里讲的是电力大数据@@@@@@,一个家里边是否有人在@@家@@,是否有人回来@@,根据用电的情况是能区别出来@@。所以@@,国网电力杭州公司@@,作为@@1000多万条数据@@收集@@,开发出大数据@@@@分析的算法@@,能够很好的知道@@,这里边@@有没有居家隔离的人@@,有没有独居的人@@,社区可以根据这个来判断是不是做针对性地服务@@。

  利用电力的用电状况@@,我们也可以知道复工状况@@,根据用电量@@,广东在@@@@2月@@14日@@已经是正常时候用电量的@@60%,也就是复工率差不多@@60%。浙江@@2月@@14日@@的复工率不到@@1/3,尤其是温州@@,属于疫情比较严重的地方@@,复工率只有@@@@12%。这些@@是可以比较宏观地掌握了复工的趋势@@。

  医疗大数据@@@@助力智能诊断@@

  大数据@@@@不仅用于追踪人群等等@@,还可以帮助智能诊断@@。从@@现在@@统计看@@,新冠肺炎患者的核酸检测@@,目前@@只有@@@@30%是阳性@@,尽管它是患病的人@@,确诊了@@,但是@@只有@@@@30%。原因是什么@@?取样是从@@口腔部来取样的@@,实际上@@这里边@@感染不算严重@@,肺部才严重@@。

  因此@@,判断还要根据@@CT,一个肺扫描出几百张这样@@CT照片@@,一张张看是比较难的@@,利用大数据@@@@@@,我们可以用人工智能的技术@@,可以把它还原回一个@@3D三维的肺@@,比较容易看有没有纤维化@@,有没有肺变形@@、毛玻璃状@@。

  同时@@,现在@@还可以根据医疗的经验@@,开发出感染肺炎患者的@@CT影像大数据@@@@分析评价系统@@,不一定要医生看了@@,这些@@CT照片@@可以放系统上@@,进行分析@@,能帮助医生进行病灶分析@@。过去医生可能要看@@5个多小时@@,现在@@几分钟就可以@@,因为它把几百张变成一张了@@。

  大数据@@@@在@@新冠病毒肺炎新药与疫苗研制中的作用@@

  大数据@@@@本身在@@新冠肺炎新药研制和@@疫苗研制里@@,也会发挥作用@@。新药研制总体上过程是比较长的@@,新药的筛选@@、活性的评价@@、药理的分析@@、安全评价等等@@,到临床还要做很多工作@@。

  目前@@是没有特效药的@@,所以@@,另外@@一种途径是老药新用@@,把一些过去抗艾滋病@@、流感的药物重新检验一下@@,看它有没有可能对新冠肺炎有效@@。我们知道@@,已经上市的和@@临床实验的药有近万种@@,一种一种来筛选时间是很长的@@,而且现在@@去积累数据@@@@,已经不容易了@@,如果原来有积累更多@@的数据@@更好@@。

  这里举一个例子@@,清华的药学院@@,它的人工智能药物研发大数据@@@@平台@@@@,收集了以前冠状病毒研究里边涉及的@@900多个小分子的实验信息@@,利用这个就有可能加快药物的筛选@@。

  大数据@@@@优化医疗紧缺物资的生产组织与调度@@@@

  大数据@@@@也在@@优化医疗紧缺物资的生产组织和@@调度@@上有很好的用处@@。海尔开发了疫情医疗物资信息共享资源汇聚平台@@@@,一方面连接医院@@,780多家@@医院@@;另一方面联系需求的社区@@,以及能生产这些@@医疗物资的企业@@500多家@@,它发布了这个需求@@5000多万件@@,另外@@,它的采购不限于中国@@,还到全球@@,所以@@实现了抗疫资源的精准对接@@。湖北@@有一个医疗物资需求平台@@@@,是由志愿者开发的@@,它爬取网上的数据@@@@,按城市医院类别分类@@,登出需求@@、运输和@@联系方式@@。

  四川也开发了防控应急物资的管理系统@@,把物资的入库@@、调度@@、审批@@、库存@@、日@@常消耗需求汇总在@@一起@@,提高了应急物资配置的调度@@效率@@,当然@@这些@@都是从@@网上获取数据@@@@。

  现在@@难题是什么@@?我们的卫健委@@@@,并没有得到所有医院的床位数据@@@@,因为过去是不联网的@@,这样导致我们不能实时地知道什么床位是有富余的@@,什么可以调度@@出来@@。所以@@这也说明@@,我们过去这方面的工作都不足@@。

  相关数据@@的融合将能得到更有价值的结果@@

  另外@@,数据@@需要融合@@,现在@@不少小区实行了封闭管理@@,现在@@已经有上线的专项排查@@APP,不用手登记@@,用手机一扫身份证@@@@,报上体温@@,数据@@自动联网@@。还可以记录下来现在@@到药店购买发烧药@@、咳嗽药的人的实名数据@@@@,因为有些人已经有病了@@,没到医院自己买药@@,实际上@@是有很大风险的@@。我们还可以将公交卡@@、网约车的数据@@结合起来@@,这次@@疫情也是考验我们@@,联防联控协调调度@@的机制@@,包括跨部门大数据@@@@的协调能力@@。

  大数据@@@@协力企业复工@@

  现在@@是复工了@@,很多企业需要工人@@,但是@@人员流动密集又有风险@@,因此@@企业面临两难@@。杭州采用一种绿红黄三色的健康码的管理方式@@,区别用户是不是接触过确诊患者@@、疑似患者@@,是不是来自重点疫区@@,以及隔离长短@@,可以分别对待@@。但是@@,你会担心填报是不是真实@@?这里边@@健康码是要联系到云端的@@,跟@@网上掌握的数据@@匹配@@,大数据@@@@能查出不实的信息@@。

  大数据@@@@与隐私保护@@

  大数据@@@@是双刃剑@@,怎么做到隐私保护@@。实际上@@,电信的大数据@@@@只考虑了信令和@@计费@@,不含通信的内容@@,但是@@尽管这样@@,患者的行为数据@@也是敏感的@@。电信大数据@@@@目前@@只限于疫情的管控@@,疫情结束@@以后@@,不会再保留有关的原始数据@@@@,现在@@特别要注意的是@@,除了国务院卫生健康部门依法授权的机构以外@@,其他任何单位和@@个人@@,不得以疫情防控@@@@,治病防治为由@@,未经被收集者同意收集用户的个人信息@@。这里就难了@@,又要保护个人信息@@,又要利用大数据@@@@@@联防联控@@,怎么办呢@@?有一种方法@@,就是原始数据@@可用不可见@@。

  什么叫可用不可见@@?有关部委@@,卫健委@@、交通@@部@@、公安部@@、工信部等可以上报数据@@的样本@@,帮助疫情大数据@@@@分析调试平台@@来调试我们的算法和@@程序@@,一旦调试好程序@@,再下发到相关部委@@,在@@相关部委的各自范围里头运行并产生结果@@。最后@@汇报给上面的结果已经不是原始数据@@了@@。

  通过这样@@,不改变数据@@的归属所有权和@@存储位置@@,只带走了不含敏感数据@@的分析结果@@。

  疫情大数据@@@@系统的信息安全防护@@

  疫情大数据@@@@也是需要特别进行安全防护的@@,从@@右上角的图可以看出绿色@@是健康数据@@@@,健康数据@@是黑客所重点关注的@@,甚至@@2014年@@,我们国家的国航网站受攻击最多的是医疗卫生的网站@@。

  美国也统计过@@,遭遇黑客医疗数据@@的泄露损失很高@@,而且疫情大数据@@@@不但是@@商业利益问题@@,还关联国家政治社会问题@@,我们以为疫情大数据@@@@系统是内网@@,但实际上@@内网也会遭遇攻击@@。我们在@@@@疫情大数据@@@@的系统上@@,要明确接入权限与过程审计@@,用各种各样的安全措施来确保安全@@。

  为何新冠疫情大数据@@@@姗姗来迟@@

  为什么@@这次@@新冠疫情大数据@@@@来得晚呢@@?这上面是谷歌有一年@@某个地方发生流感@@,谷歌的报告流感比美国疾控中心还提前一个星期@@,相似度@@97%。它能提前预警@@,而中国的这次@@疫情大数据@@@@@@,基本上没有起到预警作用@@,为什么@@?网上人说@@,你们说得那么好@@,为什么@@你们没有早说出来@@?原因是网上信息很多@@。

  传染病根本没有被列到互联网界关注的优先点@@,另外@@在@@发现不明肺炎之初@@,医疗机构的信息中心也没有能够根据十多例的病情分析出人传人@@,掌握不了病毒控制的主动权@@,应该说@@,可惜我们信息技术人员敏感性不够@@。

  大数据@@@@依赖真实数据@@的开放@@

  另外@@一个更重要原因@@,是数据@@的披露开放之后不及时@@。在@@发现最初动物作为@@传染源的时候@@,案例是比较少的@@,很难触发疫情大数据@@@@的分析@@。发展到人传人的时候@@,电信以及互联网公司的人行为轨迹的大数据@@@@才有作用@@,我们知道@@,武汉的重症病例从@@发病到住院平均等待了将近@@10天@@,有些还没等到住院就不行了@@。

  整个获得信息延误了@@10天@@,再加上@@14天@@左右的潜伏期@@,病毒已经蔓延了一个多月@@@@,而且一些错误的信息@@,“不会人传人@@”“可防可控@@”在@@发布@@。而真实的信息被当做谣言@@,疫情的数据@@没有对外公布@@,当公众知道病毒可以人传人的时候@@,已经错过了防控的黄金时间@@,造成了武汉疫情爆发长时间失控@@,这种公布数据@@@@,不仅仅是为了大数据@@@@分析@@。

  华盛顿大学有一个研究@@,“当媒体的报道量增加@@10倍@@,疾病的感染数会减少@@33.5%”,所以@@应该是更有用的@@。

  大数据@@@@的应用需要有法律保证@@

  另外@@,大数据@@@@的应用需要法律保证@@。《传染病防治法@@》规定@@,有关部门要报告疫情和@@监测@@,但是@@没有明确哪一级地方政府有权收集当地运营商跟@@疫情有关的数据@@@@,也没有明确政府应该开放什么数据@@@@,应该公布什么信息@@。

  所以@@,我们建议@@,要出台@@《传染病防治法@@》的实施细则@@,要明确省市政府对疫情防控@@数据@@的收集权限和@@政府各个部门@@,以及相关企业提供疫情防控@@有关数据@@的责任@@。

  电信大数据@@@@对疫情防控@@有用但还不够@@

  因为用户的信令数据@@面很广@@,而且实时性很好@@。实际上@@,每个用户平均每天@@有@@200条左右的信令数据@@@@,应该是很好的@@,很详尽@@。基站的定位精度只有@@百米的量级@@,实际上@@100米的半径里@@,根据这个来确定密切接触者是不准确的@@,因为有很多人隔@@100米和@@隔@@10米的情况是不同的@@。

  卫星导航@@@@+数字地图的定位精度是比电信基站的定位精度要优@@,但是@@它的用数覆盖不够@@,所以@@两者的结合可能比较好@@。电信大数据@@@@对疫情防控@@是有很好作用的@@,但是@@还是有限的@@,所以@@仅有电信大数据@@@@不够@@,需要跟@@有关部委@@融合@@。

  大数据@@@@是方法与辅助工具@@

  大数据@@@@本身是一种方法@@,整个医疗不仅仅是在@@院中@@,还涉及到院前@@、院后和@@医院管理@@,涉及到很多环节@@。大数据@@@@也不是智慧医疗的唯一方法@@,也是要跟@@其他信息技术结合@@,同时@@也要跟@@医学专业知识结合@@,需要信息技术和@@医学界的紧密合作@@。

  最后@@,跟@@17年@@前的非典疫情相比@@,本次@@疫情是更严峻的大考@@。但现在@@用上了先进的医疗技术和@@大数据@@@@等新一代信息技术@@,科学防治@@、精准施策@@。在@@党中央的坚强领导下@@,在@@疫情防控@@的人民战争中@@,大数据@@@@的应用环境将进一步优化@@,在@@联防联控精准施策@@中将发挥更大的作用@@。我们一定能够打赢疫情防控@@的人民战争@@、总体战@@、阻击战@@。

责任编辑@@:qinpeng