2020-10-13 22:31:05
来 源
中存储
大数据
什么是大数据(Big Data)?大数据其实指的是创新的数据处理方式。大数据可定义为:解决传统数据挖掘和处理技术无法解决的海量、复杂数据的过程。

什么是大数据(Big Data)?

什么是大数据(Big Data)?

首先,大数据不是真的一个大数据文件,比如我有个100000GB的文件,它是大数据吗?不是滴,您这只是个大文件而已。

大数据其实指的是创新的数据处理方式。

Gartner对big data的定义

大数据是高容量,高速度和/或多种信息资产,需要经济高效的创新形式的信息处理方式,以增强洞察力,决策和流程自动化。 

 

 

什么是大数据(Big Data)?

 

解析:

大数据是指传统数据挖掘和处理技术无法揭示基础数据的见解和含义时使用的过程。关系数据库引擎无法处理非结构化或时间敏感或非常大的数据。此类数据需要另一种称为大数据的处理方法,该方法在易于使用的硬件上使用大规模并行处理。

简而言之,大数据反映了我们生活中不断变化的世界。变化越多,捕获和记录的变化就越多。以天气为例。对于天气预报员而言,世界各地收集的有关当地情况的数据量非常可观。从逻辑上讲,当地环境决定区域效应,而区域效应决定全球效应,这是有道理的,但是反之亦然。这种天气数据以一种或另一种方式反映了大数据的属性,其中需要对大量数据进行实时处理,并且可以通过机器生成大量输入,个人观察或太阳斑等外力。

像这样处理信息说明了为什么大数据变得如此重要:

  • 与传统的关系数据库相比,现在收集的大多数数据都是非结构化的,并且需要不同的存储和处理方式。
  • 可用的计算能力飞速增长,这意味着有更多的机会处理大数据。
  • 互联网使数据民主化,在不断增加可用数据的同时还产生越来越多的原始数据。

原始格式的数据没有价值。数据需要进行处理才能有价值。但是,这里存在大数据的固有问题。从原始对象格式处理数据到可用的见解是否值得这样做呢?还是存在太多具有未知值的数据以证明使用大数据工具对其进行处理的赌博?我们大多数人都同意,能够预测天气将具有价值,问题是该价值是否会超过将所有实时数据整理成可以依靠的天气报告的成本。

 

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。