?它从何而来?
从本质上来说,大数据是指数据量非常大,以至于传统数据处理工具和方法(例如 Excel 电子表格或文本处理器)无法处理的数据。
“数据太大,移动速度太快,或者不 喀麦隆电话号码资源 符合数据库架构的约束。要从这些数据中获取价值,您必须选择另一种方法来处理它。” –福布斯
由于科技的进步,世界上90%的数据是在过去两年内产生的。
我们个人每秒都会产生1.7兆字节(一百万字节)的数据,相当于每天1.145万亿兆字节。
到 2025 年底,我们每天可能会产生大约 463 EB的数据。
为了更清楚地说明这一点,现在大多数智能手机都配备了 64 GB(十亿字节)的存储空间。64 GB 仅为 0.0000000064 EB。
大数据的视觉视角
图片来源:Backblaze
这些数据量非常大。因此被称为“大数据”。
但大数据不仅仅关乎数量……
大数据和三个“V”
大数据是一个相对较新的术语,但大数据的概念(数据的收集、存储和处理)却是一个古老的概念(至少有二十年历史)。
它始于 21 世纪,当时行业分析师 Doug Laney 将大量数据的收集和利用概括为三个“V”:
Volume(容量):指的是正在处理的数据量。
速度:表示处理数据的速度。
种类:说明正在处理的不同类型的数据。
这三个属性定义了大数据。
“大数据是包含更多种类的数据,其数量不断增加,速度也越来越快。 ” – Oracle
这就是大数据,但是……
所有这些数据从哪里来?
大多数企业每天都会被大量数据淹没,其中大部分