聚类的应用有哪些?

聚类有多种应用,如下所示 -

  • 可扩展性- 一些聚类算法在包括少于 200 个数据对象的小数据集中运行良好;然而,一个庞大的数据库可以包含数百万个对象。对给定的庞大数据集的样本进行聚类可能会导致有偏差的结果。需要高度可扩展的聚类算法。

  • 处理不同类型属性的能力- 一些算法旨在对基于间隔的(数字)记录进行聚类。但是,应用程序可能需要对多种类型的数据进行聚类,包括二进制、分类(名义)和序数数据,或这些数据类型的组合。

  • 发现任意形状的集群- 一些聚类算法根据欧几里德或曼哈顿距离度量确定集群。基于这种距离度量的算法倾向于发现具有相同大小和密度的球形簇。然而,簇可以是任何形状。开发能够识别任意形状集群的算法至关重要。

  • 确定输入参数对领域知识的最低要求- 一些聚类算法需要用户在聚类分析中输入特定参数(包括所需聚类的数量)。聚类结果对输入参数非常敏感。参数很难决定,特别是对于包含高维对象的数据集。这不仅给用户带来负担,而且造成难以控制的聚类质量。

  • 处理嘈杂数据的能力- 一些真实世界的数据库包括异常值或丢失、未知或错误的记录。一些聚类算法对此类数据很敏感,可能会导致聚类质量较差。

  • 对输入记录的顺序不敏感- 一些聚类算法对输入数据的顺序做出响应,例如,类似的数据集,当向这种算法提供多个排序时,它可以生成截然不同的聚类。开发对输入顺序无响应的算法至关重要。

  • 高维- 数据库或数据仓库可以包含多个维度或属性。一些聚类算法最擅长管理仅包含两到三个维度的低维数据。人眼最擅长确定最多三个维度的聚类质量。在高维空间中对数据对象进行聚类是有争议的,特别是考虑到高维空间中的数据可能非常不足且被高度错误表示。

  • 基于约束的聚类- 现实世界的应用程序可能需要在多种类型的约束下执行聚类。考虑到您的工作是为城市中给定数量的新自动取款机 (ATM) 选择区域。

以上是 聚类的应用有哪些? 的全部内容, 来源链接: utcz.com/z/360170.html

回到顶部