为什么我们需要 KDD?

将数据转化为知识的传统技术依赖于人工分析和解释。例如,在医疗保健行业,专家们熟悉每个季度系统地分析医疗保健数据的当前趋势和变化。

专家支持向赞助医疗机构提交详细分析报告;该报告成为未来医疗保健管理决策和规划的基础。有几种类型的应用程序,包括行星地质学家筛选行星和小行星的遥感图像,仔细定位和编目诸如撞击坑之类的感兴趣的地质对象。

这种对数据集进行手动探测的形式速度慢、价格高且主观性很强。随着数据量的急剧增加,这种手动数据分析在多个领域变得完全不切实际。

在商业领域,KDD 的主要应用领域包括营销、金融(尤其是投资)、欺诈检测、制造、电信和网络代理。

营销- 在营销中,基本应用是数据库营销系统,它分析客户数据库以识别多个客户群并预测他们的行为。

投资- 几家公司使用数据挖掘进行投资,但大多数不代表他们的系统。一个例外是 LBS 资本管理公司。它的系统使用专业系统、神经网络和遗传算法来处理总计 6 亿美元的投资组合;自 1993 年启动以来,该系统的表现优于大盘。

欺诈检测- HNC Falcon 和 Nestor PRISM 系统用于检查信用卡欺诈,监视数百万个帐户。美国财政部金融犯罪执法网络的 FAIS 系统可以识别可能表示洗钱活动的金融交易。

制造- CASSIOPEE 故障排除系统,作为通用电气和 SNECMA 合资企业的一个要素而开发。欧洲三大航空公司使用它来诊断和预测波音 737 的问题。

电信- 电信警报序列分析仪 (TASA) 是与电信设备制造商和三个电话网络(Mannila、Toivonen 和 Verkamo 1995)合作开发的。该系统使用一种新颖的基础设施,用于从警报流中定位频繁发生的警报事件并将其显示为规则。

可以使用提供交互性和迭代的灵活数据检索工具来探索大量已发现的规则。在这种方法中,TASA 提供修剪、分组和排序设备来优化基本的蛮力搜索规则的结果。

数据清理- MERGE-PURGE 系统用于识别重复的福利索赔(Hernandez 和 Stolfo 1995)。它被大量用于华盛顿州福利部的数据。

以上是 为什么我们需要 KDD? 的全部内容, 来源链接: utcz.com/z/358008.html

回到顶部