什么是分类和预测?

分类

分类是一种数据挖掘方法,用于预测数据实例的团队成员。在分类中,有一个目标分类变量,包括收入等级。例如,它可以划分为高收入、中等收入和低收入三个等级或类别。

数据挖掘模型分析了大量记录,每条记录都包含有关目标变量的数据和一组输入或预测变量。例如,考虑表中数据集的摘录。

收入分类数据集摘录

主题年龄性别职业收入范围
00147Female软件工程师High
00228Male顾问Middle
00335Male失业低的

假设研究人员根据与该人相关的其他特征(包括年龄、性别和职业)对数据库中不存在的人的收入等级进行分类就足够了。该任务是分类任务。它非常适合数据挖掘方法和技术。

该算法将大致如下进行。首先,考虑包含预测变量和(先前分类的)目标变量、收入等级的数据集。

在这种方法中,算法了解哪些变量组合与哪些收入等级相关。例如,老年女性可能与高收入阶层有关。该数据集称为训练集。

商业和研究中的分类任务示例包括 -

  • 它可以决定特定的信用卡交易是否具有欺诈性。

  • 它可以将新候选人定位到有关某些要求的特定轨道中。

  • 它可以用来检查抵押软件的信用风险是好是坏。

  • 它可以调查特定疾病是否是显示。

  • 它可以确定某些财务或个人行为是否表示可能的恐怖主义威胁。

预测

预测与分类相同,只是为了预测,结果在未来会被歪曲。

商业和研究中预测任务的例子包括 -

  • 它可以预测未来三个月内股票的价值。

  • 如果提高限速,它可以预测明年交通死亡的百分比增加。

  • 它可以预测今年秋季棒球世界系列赛的获胜者,这取决于球队统计数据的相似性。

  • 它可以预测药物发现中的特定分子是否会为制药组织启动一种有利可图的新药。

以上是 什么是分类和预测? 的全部内容, 来源链接: utcz.com/z/338648.html

回到顶部