4.1 相关分析的概念和相关分析过程
4.2 两个变量间的相关分析
4.3 偏相关分析
4.4 距离分析
4.1.1相关分析的概念
研究变量间密切程度的一种常用统计方法
1,线性相关分析:研究两个变量间线性关系的程度.用相关系数r来描述.(详见下面)
2,偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系
3,相似性测度:两个或若干个变量,两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述.相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远
线性相关分析
研究两个变量间线性关系的程度.相关系数是描述这种线性关系程度和方向的统计量,用r表示.
如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1
0.5 |r|<0.8 中度相关;
0.3 |r|<0.5 低度相关;
|r|.5,认为中度相关)
P213 Data10-02 某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性相关(比较有用的结果: 秩相关系数r和其相应的显著性概率Sig(秩相关系数均>.5,认为中度相关)
4.3 偏相关分析的概念 P218
线性相关分析计算两个变量间的相关关系,分析两个变量间线性关系的程度.往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度.如身高,体重与肺活量之间的关系.如果使用Pearson相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线性关系.但实际上,如果对体重相同的人,分析身高和肺活量,是否身高越高,肺活量就越大呢 不是的.原因是身高与体重有线性关系,体重与肺活量存在线性关系,因此得出身高和肺活量之间存在着较强的线性关系的错误结论.
偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量.
分析身高与肺活量之间的相关性,就要控制体重在相关分析中的影响.实际生活中有许多这样的关系,如可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间的相关关系.可以在控制了销售能力与各种其他经济指标的情况下,研究销售量与广告费用之间的关系等.
4.3 偏相关分析的SPSS过程和实例
菜单:Analyze+Correlate+Partial
Variables:分析变量
Controlling for:控制变量
实例P220Data10-03 使用四川绵阳地区3年生中山柏的数据,分析月生长量hgrow与月平均气温temp,月降雨量rain,月平均日照时数hsun,月平均湿度humi这四个气候因素的哪个因素有关.
将月生长量hgrow作为分析变量,
然后分四次,分别将其中的一个因素作为分析变量,而其他三个作为控制变量
用Pearson相关系数
结果P223:中山柏生长量与气温temp关系最为密切,相关系数0.9774,显著性概率p=0.000;其次是湿度humi,相关系数0.7310,显著性概率p=0.025;日照时数hsun,相关系数0.6318,显著性概率p=0.068;与降雨量没有线性关系,降雨量过大,还会影响其生长.
4.4 距离分析P224
是对观测量之间或变量之间相似或不相似程度的一种测度,是一种广义的距离.
有关的统计量.
不相似性测度:a,对等间隔(定距)数据的不相似性(距离)测度可以使用的统计量有Euclid欧氏距离,欧氏距离平方等. b, 对计数数据使用卡方. c,对二值(只有两种取值)数据,使用欧氏距离,欧氏距离平方,尺寸差异,模式差异,方差等
相似性测度:a,等间隔数据使用统计量Pearson相关或余弦. b,测度二元数据的相似性使用的统计量有20余种.
距离分析分为观测量之间距离分析和变量之间距离分析.
4.4.3 距离分析实例
实例P227Data10-03 仍使用四川绵阳地区3年生中山柏的数据.
菜单:Analyze+Correlate+Distance
观测量间的距离分析(不相似性测度,使用欧氏距离),分析月生长量hgrow
Variables分析变量:月生长量hgrow
Label Case by:月份Month
Compute Distances:Between Case
Measure:不相似性测度
结果P228:观测量间的欧氏距离(1月与8月的生长量最不相似,其欧氏距离值为19.290,而1月与2月生长量不相似性最小,值为0.490)
变量间的不相似性
Variables分析变量:temp,rain,hsun,humi
Compute Distances:Between Variables
Measure:不相似性测度,欧氏距离,
分析变量测度的单位不同,所以要进行标准化,Transform Values:By Variable,Z Score
结果P229:变量间的欧氏距离矩阵(不相似矩阵)
还可以重新进行相似性分析,得Pearson相关系数矩阵,然后跟欧氏距离矩阵相比较.