此前介绍了在线性回归模型中不同变量效应大小的比较方法,在Logit、Ologit概率模型中, beta选项不能使用,在此介绍概率模型中的输出标准化系数的方法
标准化系数是什么?
标准化系数是指将数据标准化后计算得到的回归系数。数据进行了标准化后可以取消不同变量量纲的影响 为了比较模型中不同变量效应的大小,需要进行标准化处理。例如:足球比赛中,比较射门、罚球点球对积分的影响效应大小,自变量:射门、罚球点球;因变量:比赛结果。根据回归系数可知自变量每增加一个单位,引起的对因变量的影响大小,但两者相比,谁的影响更大则需要进行标准化处理
注:数据为足球技战术指标(因变量:比赛结果(Mdf,胜3、平2、负1;Mdf1,不败1、负0);自变量:射门shoot、罚球点球dq);数据、模型结果为举例说明,不代表真实情况。
方法一:标准化变量再回归
(注:仅适用于ologit模型,logit模型不适用)
将原始的变量转化成无量纲的标准化数据,使得回归后的系数具有可比性
第一步 对变量进行标准化处理
生成新变量t_Mdf、t_shoot、t_dq
egen t_Mdf=std(Mdf) //变量标准化
egen t_shoot=std(shoot) //变量标准化
egen t_dq=std(dq) //变量标准化
第二步 对标准化后的数据进行拟合
ologit t_Mdf t_shoot t_dq ,nolog //输出结果为标准化后的系数
方法二:使用listcofe命令
(注:仅适用于logit模型,ologit模型不适用)
第一步 回归
logit Mdf1 shoot dq,nolog //
第二步 输出标准化系数
listcoef ,std help //
注:logit、ologit模型是概率模型,一般结合回归系数方向和OR值来解释模型的,比较不同变量的效应大小后注意多种方法结合使用以解读模型