什么是大数据
如题 什么是大数据 现在这东西好火啊 感觉不知道就奥拓了
------解决方案--------------------不知道可不可以这么理解“大数据”:
第一,数据量是海量的,海量到进行查询、统计分析必须使用并行计算技术才能很好地完成。
第二,数据是非结构化的、形式多样的。它目前不一定以一个数据库的形式存在。可能是分布在好多服务器上的一些数据文件、数据库、文档甚至图像、影音文件的集合。而且,还可能混杂着多种形式。
第三,这些数据本身并不直接体现价值。你需要对这些数据进行挖掘和分析才能得到想要的结果。通常,这个分析结果可能是一个统计上的、趋势上的结论。相关性分析、统计模型、线性的和非线性的机理模型可能是需要的工具。这些分析过程所用到的样本并不需要特别精确。例如分析顾客的消费行为,由于实时性等原因,少统计某一个用户对结果几乎毫无影响。
第四,貌似是对分析的时限有严格的要求(1秒定律)。例如,通过对气象数据的分析预测化工厂危险气体泄漏后的波及范围,这需要很快得到结论。这虽然不一定就是1秒,但的确对分析计算速度有很高的要求。
------解决方案--------------------以前,人们分析事物靠的是理论研究、学习。
而如今,有些人全靠海量收集别人的垃圾,然后让计算机帮自己照抄。
这就是大数据。
------解决方案--------------------以前,我们把垃圾都倒掉。
而今天,有些人专门囤积大家的垃圾,舍不得扔掉。因为他们再也不相信智能,而是相信垃圾处理必定可以变废为宝。
于是就有一些专门研究如何囤积垃圾的公司发财了,因为白痴越来越多了。
------解决方案--------------------大数据不能望文生义是“很大的数据”,或者海量数据。
大数据主要是指围绕相同事物而得到的产生的复杂的数据——数据多只是其中之一,数据结构复杂、关系复杂、种类复杂、表现形式复杂、分析和处理的方式复杂,这才是大数据根本的特征。
------解决方案--------------------4L的理解基本是正确的。