大数据@@@@更需要强调数据@@挖掘@@利用@@,而针对目前存在的@@技术应用@@、人才@@、安全与隐私等问题@@,最关键的@@是要有国家大数据@@@@战略@@,使其成为转变经济增长方式的@@有效抓手@@。

 
  不要被大数据@@@@@@(Big Data)的@@“Big”误导@@,大数据@@@@更强调的@@不是数据@@之多@@,而是数据@@挖掘@@@@。数据@@大与价值大未必成正比@@,例如将一个人每分钟的@@身体数据@@记录下来@@,对了解该人的@@身体状况是有用的@@@@,但如果将他每毫秒的@@身体数据@@都记录下来@@,数据@@量将较前者高@@6万倍@@,与按每分钟记录的@@数据@@相比@@,其价值并不能增加@@。大数据@@@@的@@价值在于样本数的@@普遍性@@。统计一个人每分钟的@@身体状况数据@@与统计@@60个人每小时的@@身体状况数据@@相比@@,可能后者在统计上更有意义@@。大数据@@@@往往是低价值密度@@。大数据@@@@中的@@多数数据@@可能是重复的@@@@,忽略其中一些数据@@并不影响对其挖掘的@@效果@@。因此可以说大数据@@@@的@@价值好似沙里淘金和海底捞针@@。
 
  大数据@@@@的@@量越大处理难度就越大@@,就需要更多@@的@@服务器或更高速的@@服务器@@。实时性是大数据@@@@挖掘@@面临的@@挑战@@,而非结构化是大数据@@@@挖掘@@的@@主要挑战@@。目前国际上大数据@@@@处理技术主要集中在结构性数据@@@@,但是大数据@@@@中@@80%以上都是非结构性数据@@@@。目前国内外都有很多大数据@@@@应用成功的@@例子@@,但基本上还是结构性数据@@@@,对结构性数据@@的@@挖掘是大数据@@@@应用的@@切入点@@。

责任编辑@@:admin