聚类分析在用户分类中的应用
来源:学问馆 本文已影响2.86W人
来源:学问馆 本文已影响2.86W人
什么是聚类分析?
聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。
聚类分析的基本过程是怎样的?
选择聚类变量
聚类分析
找出各类用户的重要特征
聚类解释&命名选择聚类变量
在设计问卷的时候,我们会根据一定的.假设,尽可能选取对产品使用行为有影响的变量,这些变量一般包含与产品密切相关的用户态度、观点、行为。但是,聚类分析过程对用于聚类的变量还有一定的要求:
这些变量在不同研究对象上的值具有明显差异;
这些变量之间不能存在高度相关。因为,首先,用于聚类的变量数目不是越多越好,没有明显差异的变量对聚类没有起到实质意义,而且可能使结果产生偏差;其次,高度相关的变量相当于给这些变量进行了加权,等于放大了某方面因素对用户分类的作用。
识别合适的聚类变量的方法:
对变量做聚类分析,从聚得的各类中挑选出一个有代表性的变量;
做主成份分析或因子分析,产生新的变量作为聚类变量。聚类分析
相对于聚类前的准备工作,真正的执行过程显得异常简单。数据准备好后,丢到统计软件(通常是spss)里面跑一下,结果就出来了。
这里面遇到的一个问题是,把用户分成多少类合适?通常,可以结合几个标准综合判断:
看拐点(层次聚类会出来聚合系数图,如右图,一般选择拐点附近的几个类别)
凭经验或产品特性判断(不同产品的用户差异性也不同)
在逻辑上能够清楚地解释找出各类用户的重要特征
确定一种分类方案之后,接下来,我们需要返回观察各类别用户在各个变量上的表现。根据差异检验的结果,我们以颜色区分出不同类用户在这项指标上的水平高低。如下图,红色代表“远远高于平均水平”,黄色代表“平均水平”,蓝色代表“远远低于平均水平”。其他变量以此类推。最后,我们会发现不同类别用户有别于其他类别用户的重要特征。
聚类解释&命名
在理解和解释用户分类时,最好可以结合更多的数据,例如,人口统计学数据、功能偏好数据等等(如下图)……最后,选取每一类别最明显的几个特征为其命名,就大功告成啦!
力学在机械工程专业中的应用分析
景观建筑在园林设计中的应用分析
中国传统艺术在现代标志中的应用分析
腾讯是否应该把利用用户资料和数据而取得的收入分成给用户?
关于分层技术在计算机软件开发的应用分析的论文
多媒体技术在教学中的有效应用与存在问题分析
分析脉冲激光技术在高分子材料加工中的应用论文
分层技术在计算机软件开发中的应用效果分析论文
聚类分析的一些评价手段
追加分--管理类专业与美术类专业就业前景的分析?
浅析统计分析方法在股票最优投资中的应用论文
数据分析中,用户行为分析最重要的3个点是什么?
价值链分析在企业管理中的应用
数据分析在薪酬管理诊断中的应用
分层技术在计算机软件开发的应用分析论文
客户分类与需求分析
美育功能在青少年舞蹈教学中的运用及作用分析
自动化技术在京东无人仓库中的应用分析论文
关于计算机技术在工程管理中的应用分析报告
PDCA模式在卷烟上水平中应用分析探讨
员工激励理论在人力资源管理中的应用分析
浅谈心理学在高职教学中的应用分析的论文
基于Mahout 命令的电影聚类分析与实现论文
小学数学教育思想中分类思想的应用论文
论文:主分量分析和线性判别分析在分类问题中的应用
关联词语的分类与应用
类比推理在高中数学教学中的应用
演讲按形式进行分类可分为几类
英国读商科的专业分类针对性分析
多媒体手段在经济类课程教学中的应用
自动化技术在汽车机械控制系统中的应用分析论文
GIS在企业物流管理中的应用分析的论文
技术分析方法的分类和注意事项
2017最新分类教学法在初中语文作文教学中的运用
心理学原理在班级工作中的应用分析
《马世文通》的连词分类分析
自动识别技术在物流管理中的应用分析论文
专题组座谈教学法在大学课堂中的应用分析
电子技术在电力能源计量管理中的应用分析论文
人力资源管理成本在企业中的应用分析论文
名企面试题分类解析