什么是大数据?
简单来说,大数据是比传统数据更大、更复杂、但随着时间呈指数增长的数据集合。它是如此庞大,以至于传统的数据管理软件或工具都无法有效地管理、存储或处理它。因此,它需要通过不同的方法逐步处理。
大数据的应用是
银行和证券
通讯、媒体和娱乐
医疗保健机构
教育
制造业和自然资源
政府
保险
零售和批发贸易
运输
能源和公用事业
大数据的用途是
位置追踪
精准医学
欺诈检测和处理
广告
娱乐与媒体
真实世界的大数据示例
发现消费者的购物习惯。
个性化营销。
用于运输行业的燃料优化工具。
通过可穿戴设备的数据监控健康状况。
自动驾驶汽车的实时道路测绘。
流线型的媒体流。
预测库存订购
大数据问题
大数据存在三个问题,它们如下 -
低质量和不准确的数据
低质量的数据或不准确的数据质量可能会导致不准确的结果或预测,这只会浪费个人的时间和精力。
为了解决、预测或从数据中发现新模式,数据必须是高质量和准确的。
处理大型数据集
由于数据量很大,没有传统的数据管理工具或软件可以直接/轻松地处理,因为这些大数据集的大小通常以TB为单位,很难处理。
因此,我们需要经过各个阶段来处理数据,例如删除不必要的低质量数据、按某些定义的因素对数据进行分区等。
整合来自不同来源的数据
数据来自各种类型的来源,如社交媒体、不同网站、捕获的图像/视频、客户日志、个人创建的报告、报纸、电子邮件等。
收集和整合不同类型的各种数据是一项非常具有挑战性的任务。
以上是 什么是大数据? 的全部内容, 来源链接: utcz.com/z/353570.html