第7章 客户特征聚类
无监督学习的神经网络所具有的神奇功能之一是能够找到数据中的隐藏模型,对于这些隐藏模型,甚至连专家都可能没有任何线索。在本章中,我们将通过使用事务数据库来查找客户组(簇)这样一个实际应用,并探索这个迷人的特性。我们将简单回顾无监督学习和聚类任务。为了演示此应用,本书将为读者提供一个关于客户聚类分析的实际示例及其在Java中的实现。在本章中,我们涵盖以下主题:
- 聚类任务
- 聚类分析
- 聚类验证
- 应用无监督学习
- 神经网络和径向基函数
- 用于聚类的Kohonen 网络
- 处理不同类型数据
- 客户特征分析
- 预处理
- Java实现
- 信用分析和用户特征
7.1 聚类任务
聚类分析是广泛的数据分析任务中的一部分,其目的是将看起来更相似,彼此更类似的元素组合成簇或组。聚类任务完全基于无监督学习,因为不需要含有任何目标输出数据就能找到簇。相反,解决方案设计者可以选择自己想要将记录分组的数量并检查算法对其的响应。
提示:
聚类任务可能与分类任务重复,其中至关重要的区别在于聚类中,在运行聚类算法之前不需要有预定义的类集合。
当只有很少或根本没有关于如何将数据聚集到组中的信息时,人们希望应用聚类分析。假如有一个数据集,我们希望神经网络识别组和它们的成员。虽然在二维数据集中可视化地执行似乎更简单直接。但是,当维度更高时,该任务的执行变得不那么简单并且需要算法解决方案。二维聚类的示例如图7-1所示。
图7-1
在聚类分析中,簇的数量不是由数据决定的,而是由期望聚集数据的数据分析人员决定的。这里,边界与分类任务的边界稍有不同,因为它们主要取决于集群的数量。 ...
Get 神经网络算法与Java编程 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.