数据分析进阶 - 评分模型权重计算方法

news/2024/7/5 3:36:40
前言

在之前的经历里遇到一些需要确定各部分权重来得出最终结果的问题,例如用户游戏偏好得分的计算、用户价值模型的构建以及贡献度的计算等,所以这篇博客就讲讲如何确定权重~

权重计算方法

权重是指某因素在整体评价中的相对重要程度。权重越高,则该因素越重要。权重有两个特点:

  • 每个因素的权重在0-1之间
  • 所有因素的权重和为1

权重的确定方法有很多,主要分为以下两大类:

主观赋权法 客观赋权法
思路与优缺点 由专家根据经验进行主观判断得到权数,然后对指标进行综合评价。这是一种定性方法,易操作,但主观性强 根据历史数据研究指标之间的相关关系或指标与评估 结果的关系来进行综合评价。这是定量研究, 没有考虑决策者的主观意愿和业务经验,同时计算方法较繁琐
常用方法 层次分析法 主成分分析法(或因子分析法)
其他方法 权值因子判断表法、德尔菲法、模糊分析法、二项系数法、环比评分法、最小平方法、序关系分析法 变异系数法、最大熵计数法、均方差法、神经网络、回归分析法等
常用方法

这里就简单说下两种方法:层次分析法和变异系数法

1.层次分析法

层次分析法简称AHP,是指将与整体决策有关的元素分解成目标、准则、方案等层次,然后进行定性和定量分析的方法。根据总的目标,可以将问题分解为不同的因素


http://www.niftyadmin.cn/n/4411297.html

相关文章

数据分析进阶 - Excel函数Phonetic

前言 之前用到过这个函数,应用在SQL查询的where子句里,但是一阵子没用脑袋就记不住了,所以借机记录下来~ Phonetic函数 PHONETIC函数可以把EXCEL一列字符放在一个单元格,这里举个小例子: 1.首先有一列数据&#xf…

Linux - nohup和后台运行Python脚本

前言 有时候Python脚本运行时间过长,可以使用后台运行的方式,本文就简单讲解下如何在Linux服务器上后台运行脚本~ 后台运行命令 nohup 用途:不挂断地运行命令 语法:nohup Command [ Arg … ] [ & ] 无论是否将 nohup 命令…

数据分析进阶 - 霍普金斯统计量预估聚类趋势

霍普金斯统计量原理 在给数据集做聚类之前,我们需要事先评估数据集的聚类趋势,要求数据是非均匀分布,均匀分布的数据集没有聚类的意义。 霍普金斯统计量是一种空间统计量,用于检验空间分布的变量的空间随机性,从而判…

数据分析进阶 - 相关分析(皮尔逊相关系数)

相关分析 相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。通过对不同特征或数据间的关系进行分析,发现其中关键影响及驱动因素。在实际的工作应用中,常常用于特征的发现与选择。针对不同数据类型的变量,需…

数据分析进阶 - 相关分析(卡方检验)

前言 上一篇博客是相关分析中的皮尔逊相关系数,具体可见链接:https://blog.csdn.net/Totoro1745/article/details/114748542?spm1001.2014.3001.5502 卡方检验 皮尔逊相关系数用于两个连续性变量,当变量为两个无序分类变量时就需要用卡方…

数据分析进阶 - 基于聚类的用户标签构建

前言 在用户画像标签体系建设的过程中,大部分标签都是以规则映射的方式构建,当规则难以梳理时,可以考虑用聚类模型进行划分,再用决策树的方式输出规则,这里仅简单分享,欢迎交流~ 示例 确定目的 对用户消…

数据分析进阶-基于tslearn的单变量时间序列聚类

前言 最近受一篇2015年文章《时间序列用户生命周期的聚类方法》的启发,阅读了很多时间序列聚类相关的方法,用消费行为的时间序列尝试去对用户行为进行分群,虽然现阶段的效果不如预期,就当总结希望后续能有所交流~ 基于日消费总额的时间序列聚类 为了更好地保留用户消费行…

数据分析进阶-基于tsfresh的多变量时间序列聚类

前言 上一篇博客主要尝试了基于tslearn的单变量时间序列聚类,多变量时间序列的方法经过一番搜索也没有找到合适的方式,因此考虑借助强大的时间序列特征提取工具tsfresh与KMeans尝试多变量时间序列的聚类实验 基于日消费总额+日消费次数的时间序列聚类 一、tsfresh tsfres…