来源:《经济研究导刊》2012年第34期  作者:张红梅;李以钢;
选择字号

基于两步聚类算法的卷烟零售客户分类研究

收藏本文  分享

一、两步聚类聚类(Cluster)就是按照一定的要求和规则对事物进行区分和分类的过程,聚类分析(Cluster Analysis)则是指用数学方法研究和处理给定对象的分类,是研究“物以类聚”问题的一种有效方法。聚类分析通常用于解决多因素、多指标的分类问题,其基本思想是根据对象间的相关程度进行类别的聚合,其所用的方法大致可分为两类:系统聚类法(Hierarchical Cluster)和非系统聚类法(Non-hierarchicalCluster)。其中,系统聚类的原理是先将所有N个变量(即观测值)看成不同的N类,然后将性质最接近(距离最近)的两类合并为一类;再从这N-1类中找到最接近的两类加以合并,依次类推,直到所有的变量被合为一类。显然,在系统聚类法中,一旦变量被划定在了一个类别中,以后它的分类结果就不会再进行更改,这是它和非系统聚类法的显著区别。两步聚类模型是一种新型的分层聚类算法(HerarchicalAlgorithms),目前一般应用在数据挖掘与多元统计的交叉领域———模式分类中,其算法适合任何尺度的变量。两步聚类分析主要是利用距离测度假设聚类模型的变量均为自变量,即假设连续(本文共计5页)......[继续阅读本文]

下载阅读本文    订阅本刊

相关文章推荐

看看这些杂志对你有没有帮助...

更多杂志>>