什么是大数据?

简单来说,大数据是比传统数据更大、更复杂、但随着时间呈指数增长的数据集合。它是如此庞大,以至于传统的数据管理软件或工具都无法有效地管理、存储或处理它。因此,它需要通过不同的方法逐步处理。

大数据的应用是

  • 银行和证券

  • 通讯、媒体和娱乐

  • 医疗保健机构

  • 教育

  • 制造业和自然资源

  • 政府

  • 保险

  • 零售和批发贸易

  • 运输

  • 能源和公用事业

大数据的用途是

  • 位置追踪

  • 精准医学

  • 欺诈检测和处理

  • 广告

  • 娱乐与媒体

真实世界的大数据示例

  • 发现消费者的购物习惯。

  • 个性化营销。

  • 用于运输行业的燃料优化工具。

  • 通过可穿戴设备的数据监控健康状况。

  • 自动驾驶汽车的实时道路测绘。

  • 流线型的媒体流。

  • 预测库存订购

大数据问题

大数据存在三个问题,它们如下 -

低质量和不准确的数据

低质量的数据或不准确的数据质量可能会导致不准确的结果或预测,这只会浪费个人的时间和精力。

为了解决、预测或从数据中发现新模式,数据必须是高质量和准确的。

处理大型数据集

由于数据量很大,没有传统的数据管理工具或软件可以直接/轻松地处理,因为这些大数据集的大小通常以TB为单位,很难处理。

因此,我们需要经过各个阶段来处理数据,例如删除不必要的低质量数据、按某些定义的因素对数据进行分区等。

整合来自不同来源的数据

数据来自各种类型的来源,如社交媒体、不同网站、捕获的图像/视频、客户日志、个人创建的报告、报纸、电子邮件等。

收集和整合不同类型的各种数据是一项非常具有挑战性的任务。

以上是 什么是大数据? 的全部内容, 来源链接: utcz.com/z/353570.html

回到顶部