什么是大@@数@@据@@@@@@@@

  大@@数@@据@@@@@@(Dig Data)是继物联网@@、云计算@@、移动互联网@@之后又一个热门的科技概念@@。目前无统一说法@@。根据@@维基百科的定义@@,它是指无法在可承受的时@@间范围内用常规软件工具进行捕捉@@、管理@@、处理的数@@据@@@@集合@@。从产业角度@@,常常把这些数@@据@@@@与采集它们的工具@@、平台@@、分析系统一起被称为@@“大@@数@@据@@@@@@”。

  最早提出@@“大@@数@@据@@@@@@时@@代@@@@已经到来@@”的机构是全球知名咨询@@公司麦肯锡@@。其在报告中指出@@@@,“数@@据@@@@已经渗透到每一个行业和业务职能领域@@,逐渐成为重要的生@@产因素@@;而人们对@@于海量数@@据@@@@的运用将预示着新一波生@@产率增长和消费者盈余浪潮的到来@@。”

  维克托@@?迈尔@@-舍恩伯格教授在书中谈到@@“首先@@,大@@数@@据@@@@@@改变了我们的思维方式@@,让我们从因果关系的串联思维变成了相关关系的并联思维@@。第二@@,大@@数@@据@@@@@@改变了我们的生@@产方式@@,物质产品的生@@产退居次@@位@@,信息产品的加工将成为主要的生@@产活动@@。第三@@,大@@数@@据@@@@@@改变了我们的生@@活方式@@,我们的精神世界和物质世界都将构建在大@@数@@据@@@@@@之上@@。”

  2013年@@被称作是中国大@@数@@据@@@@@@时@@代@@@@元年@@@@,随着技术上的进步以及大@@数@@据@@@@@@的运用@@,我们正在加快步入大@@数@@据@@@@@@时@@代@@@@@@。

  大@@数@@据@@@@@@时@@代@@@@对@@政@@治@@生@@活影响@@

  1.开放的政@@府@@@@。

  数@@据@@@@技术变革@@,何以能推动政@@府@@信息公开@@、透明和社会公正@@?

  列宁曾说过@@“没有@@公开性而谈民主制是很可笑的@@”。人民行使管理@@国家的权力@@,是以对@@公共事务的充分了解为基础的@@。目前政@@府@@作为国家各种数@@据@@@@信息资源的最大@@拥有@@者@@,已掌握全社会信息总量的大@@约@@80%,这些信息常比一般信息更有@@价值@@,也直接关系到国民经济与社会发展的状况与水平@@。大@@数@@据@@@@@@时@@代@@@@能加强对@@信息的整合@@、共享与利用@@,推行政@@府@@信息公开也成为世界各国的普遍趋势@@。

  政@@府@@作为国家行政@@机构@@,承担着大@@量公众@@事务的管理@@和服务职能@@。二十世纪的公共哲学认为@@,政@@府@@行政@@的最大@@目的在于提供公共服务@@。各级政@@府@@部门拥有@@大@@量宝贵的信息资源在大@@数@@据@@@@@@时@@代@@@@@@有@@望通过技术手段打破狭小的封闭圈子@@,从而为社会提供各种需要的数@@据@@@@资源@@,公众@@、企业和社会获取政@@府@@有@@关政@@策法规@@、各类统计信息@@、社会保障信息等的快捷和透明程度也会提高@@,数@@据@@@@信息的大@@众化使人们能够同样获取有@@价值的信息@@,一定程度能够促进社会的公正@@。

  2. 决策科学的政@@府@@@@

  除了上帝@@,任何人都必须用数@@据@@@@来说话@@。“大@@数@@据@@@@@@”时@@代@@来临决策不能只凭经验@@,而是通过大@@量可靠数@@据@@@@的分析来提高决策的科学性和有@@效性@@。

  在传统政@@务@@中@@,管理@@决策的基础是由西蒙提出的有@@限理性学说@@,信息的有@@限性是影响人们进行理性决策的直接原因之一@@。现代@@办公模式需要适应现代@@社会信息量巨大@@@@,各种因素@@、条件纷繁复杂的特点@@,作为政@@府@@领导@@,要做出正确的决策@@,需要掌握的信息@@、资源越来越多@@,大@@数@@据@@@@@@时@@代@@@@通过建立决策支持系统@@,为政@@府@@决策者提供必要的决策信息@@,改善决策者的有@@限理性@@,使决策者在全面了解决策所需信息的前提下进行决策@@。同时@@@@,大@@数@@据@@@@@@下的政@@府@@使决策实施情况的及时@@反馈成为可能@@,决策是否正确只有@@在实践中才能得到验证@@,如果决策失误@@,可以通过反馈信息不断修正和完善@@。依靠政@@府@@部门掌握的大@@数@@据@@@@@@@@,及时@@获得决策实施过程中的反馈信息@@,了解和掌握发展变化的最新信息@@,并据@@此完善或追踪决策@@。

  过去@@,我国的行政@@决策依赖地方政@@府@@和有@@关部门提供的资料@@,其中包括一些数@@据@@@@@@,有@@的甚至非常详尽@@,但由于取得数@@据@@@@的方式不是直接源于市场和社会大@@众@@,再加上一些数@@据@@@@@@“掺假@@”,导致政@@府@@的决策科学性不强@@。大@@数@@据@@@@@@时@@代@@@@数@@据@@@@来源@@广泛和直接@@,通过科学方法分析整理可以直观和准确地反映社会实际@@,有@@利于决策的针对@@性和科学性@@,同时@@@@能够有@@效配置社会资源@@,防止决策盲目造成的与实际脱节现象@@。

  3.高效快捷的政@@府@@@@

  在大@@数@@据@@@@@@时@@代@@@@@@政@@府@@部门获取@@、传输@@、应用数@@据@@@@来进行管理@@和服务的能力将会得到很大@@的提升@@,也能避免许多环节技术上或人为的差错@@。

  政@@府@@工作人员提供了现代@@化的办公手段和应用工具@@,降低了信息传输@@的时@@间成本和人力成本@@,节约了原来靠人脑和文件处理信息所消耗的大@@量时@@间和精力@@,将政@@府@@工作人员从常规的事务性工作中解脱出来@@。依托网络@@技术打破了政@@府@@工作的时@@空界限@@,加强了政@@府@@部门之间以及政@@府@@与公众@@之间的信息沟通和互动@@,使以前无法想象@@、无法实现的政@@府@@服务成为现实@@,使政@@府@@管理@@和服务更加精干高效@@。[page]

  4.更加广泛的政@@治@@参与@@

  一方面@@,随着大@@数@@据@@@@@@时@@代@@@@的到来@@,政@@府@@在财政@@预算决算@@、“三公@@”经费等大@@量数@@据@@@@信息也会逐渐揭开神秘面纱@@,网络@@、微博问政@@方兴未艾@@,既让政@@府@@信息越来越走近百姓@@,又通过公众@@和社会力量的介入@@,对@@政@@府@@的决策和监督施加影响@@。

  另一方面@@@@,现在很多人从早上起床到晚上就寝@@,都是以浏览手机开始@@,以阅读手机结束@@@@。用于网络@@的机会和时@@间越来越多@@,自然成为制造各类大@@数@@据@@@@@@的强大@@来源@@@@。大@@数@@据@@@@@@时@@代@@@@下的民意@@,只可能比以往任何时@@候都复杂多变@@。越来越多元化的新媒体及其运作模式@@,为人们提供了更多@@@@、更便利的发声渠道@@,这些声音来自社会各个阶层@@。

  大@@数@@据@@@@@@与公民个人隐私@@

  有@@项调查显示大@@多数@@受访者表示不希望企业存储个人数@@据@@@@@@,特别是反对@@企业追踪自己的上网记录@@。主张保护数@@据@@@@隐私的人认为@@,“大@@数@@据@@@@@@”理念其实与@@“专制独裁@@”没有@@区别@@。为消除人们顾虑@@,许多公司强调他们收集@@、储存@@、分析数@@据@@@@都是@@“匿名@@”,但事实上可能并非如此@@。在线期刊@@《科学报道@@》近期一项研究显示@@,每个人有@@自己的行动模式@@,95%的人可能被识别@@。普林斯顿计算机科学家阿尔温德@@?纳拉亚南在其博客上说@@,可供分析的数@@据@@@@越多@@,就越不可能保持@@“匿名@@”,识别一个人只要@@33个字节的信息量@@。

  安全领域是@@“大@@数@@据@@@@@@”应用增长最快的领域之一@@,施罗德说@@。除对@@付犯罪和恐怖主义外@@,Splunk的软件还能查明黑客攻击等网络@@犯罪@@。该软件输入了警方所有@@数@@据@@@@@@,不断更新@@,用于计算何时@@何地可能发生@@夜盗@@、抢劫@@、偷车等犯罪行为@@,其中三分之二切实发生@@了@@。美国@@“棱镜@@”计划始于@@2007年@@,主要用于监控恐怖主义活动@@,“9· 11”带来的恐慌情绪使美国@@安全部门获得了巨大@@的权力@@,“棱镜@@”只是诸多监控项目中的一个@@。美国@@情报机构一直在九家美国@@互联网@@公司中进行数@@据@@@@挖掘工作@@,使现代@@社会中每个公民都置于它的监视之下@@,且任何措施都不能保证你的安全@@,这是政@@府@@侵害公民自由的一个例子@@。

  这同时@@@@表明@@,在大@@数@@据@@@@@@时@@代@@@@@@可能意味着个人的空间@@的被挤压@@,各种数@@据@@@@的被记录和追踪会使得个人毫无隐私可言@@。

  需要警惕@@“数@@据@@@@暴政@@@@”

  一份由奥美公司所作的调查报告显示@@,75%的人不希望企业存储自己的个人信息@@,有@@90%的人反对@@企业收集自己上网浏览网页的记录@@。

  微软研究院的高级研究员博伊德曾表示@@:“如今@@,我们社交网络@@化的社会绝对@@有@@制造恐慌的天分@@。在大@@数@@据@@@@@@时@@代@@@@@@,对@@隐私泄露的担忧就是强大@@的紧张和焦虑的源泉@@。人们普遍认为@@,最令人焦虑的在于你根本不知道什么时@@候自己的隐私就无意中被泄露出去@@。”

  人们最担心的@@,是对@@这种数@@据@@@@的无限制利用@@。美国@@畅销书@@《爆发@@》中指出@@,人的行为看似随机无序@@,但实际上@@是存在某种规律的@@。社交网络@@如此发达的今天@@,大@@数@@据@@@@@@把人的行为进行放大@@分析@@,从而能够相对@@准确地预测人的性格和行程@@。所以@@,不排除有@@这样一种可能@@:在忙完了一天的工作之后@@,你还没有@@决定要去哪儿@@,数@@据@@@@中心却早就先于你准确预测了接下来的目的地@@。

  这向我们提出警醒@@:大@@数@@据@@@@@@时@@代@@@@,如何界定大@@数@@据@@@@@@的权益归属@@?如何控制大@@数@@据@@@@@@的使用风险@@?如何保持我们全社会的数@@据@@@@民主@@?

  互联网@@哲学家叶夫根尼@@·莫罗佐夫对@@许多@@“大@@数@@据@@@@@@”应用程序背后的意识形态提出尖锐批评@@,警告即将发生@@@@“数@@据@@@@暴政@@@@”。他提出@@,那些@@“大@@数@@据@@@@@@”应用程序应当接受独立审计人定期审查@@,以防权力滥用@@。

  大@@数@@据@@@@@@时@@代@@@@就是好的@@?

  从媒体和政@@治@@的关系来看@@,透过媒体传播信息以及因此生@@成的观点@@@@、分享@@等传达出海量信息@@,而人们对@@事件的关注@@@@、看法与评论@@,又有@@着短暂@@、零碎的特质@@,从而构成庞大@@而混杂的大@@数@@据@@@@@@@@,执政@@者需要进行科学而量化的分析@@,以成为勘察和了解民意的重要途径@@。

  大@@数@@据@@@@@@时@@代@@@@一个特征是数@@据@@@@价值密度相对@@较低@@,如随着物联网的广泛应用@@,信息感知无处不在@@,信息海量@@,但价值密度较低@@。在网络@@时@@代@@@@,一方面@@是信息快速@@、自由的流动@@,一方面@@也不断制造着信息的碎片化@@、歧义化@@,民意迅速@@、大@@量的爆发@@式呈现@@,事件真正的来龙去脉@@,只能在碎片化中逐步厘清@@,但同样可能存在网络@@话语权从属于强势的声音@@。在信息传递过程中@@,事件往往出现不止一个@@“版本@@”或被扭曲的现象@@,变得不可控@@、或者暗箱操控@@。一个民生@@课题在各方民意万马奔腾的发酵效应之下@@,极有@@可能引发公共危机@@,甚而影响政@@府@@决策@@。这些量化@@、细化的大@@数@@据@@@@@@分析@@,结果未必全然是理性的@@。

  大@@数@@据@@@@@@时@@代@@@@的政@@治@@@@

  美国@@的国会政@@治@@已经进入到了精算阶段@@。不仅仅是@@ K 街的游说集团基本能完全预测各个议员的投票情况@@,民间的组织和统计学家也能预测到@@。阳光基金会不但有@@手机上的@@ App 可以让网民下载@@,还有@@向开发人员提供国会数@@据@@@@的公开@@ API,可以仔细分析各个议员的投票历史@@、政@@治@@捐款行业分布@@、所在选举数@@据@@@@@@。但政@@治@@数@@据@@@@本身是被动的@@,只能如实反映潜在的政@@治@@变动和危机@@,如何解决@@,依然要靠卓越的政@@治@@领导力@@。

  人们对@@于与大@@数@@据@@@@@@@@、数@@据@@@@挖掘相关的政@@治@@问题的关注@@不应仅停留在隐私权的保护@@、商业规范的制订等方面@@。通过比较福柯所论述的规训时@@代@@与大@@数@@据@@@@@@时@@代@@@@的异同@@,可以发现大@@数@@据@@@@@@创造了以抽象的深层次@@身心机制为特征的新权力客体@@。统治@@者能够借助非系统化的海量信息对@@社会各个职能领域进行细节化的监控和管理@@@@。这种统治@@模式虽然可能造成民主危机和责任危机@@,却也蕴含着向有@@利方向变革的可能@@。实际上@@,大@@数@@据@@@@@@的合理利用@@,不仅需要技术的进步@@,更有@@赖于人们各方面素质的提高@@,以及政@@治@@意识的增强@@。

责任编辑@@:admin