如何用spss做相关分析(依托原始数据实操完成变量关联性检验)
最开始接触数据分析作业的时候,卡在如何用spss做相关分析这个操作上很久,对着网上零碎的教程乱点,越操作越混乱,出来的结果要么没有数值,要么显著性完全错乱,根本没法用到论文数据里。那段时间反复试错,才摸透了普通变量相关分析最朴实、能直接落地的实操步骤,没有花哨操作,就是最贴合本科、基础数据分析的用法。
导入数据是第一步,很多人会忽略这一步的细节。直接把Excel整理好的原始数据拖进SPSS界面就行,不用手动录入,效率会高很多。重点是数据格式,每一列对应一个研究变量,每一行是一个样本数据,绝对不能出现合并单元格、空行乱列的情况。之前偷懒没整理数据,导入后系统识别异常,后续所有分析都直接报错,白白浪费了半个多小时。
数据导入完成后,不用着急点分析按钮。先点开变量视图核对一遍,确认所有计量变量都被系统识别为尺度变量。如果有变量被归类成名义、有序变量,一定要手动修改过来。尺度变量是开展皮尔逊相关分析的前提,格式不对,后续所有运算都是无效的,这是很多新手最容易踩的隐性问题。
正式进入分析操作界面,点击顶部菜单栏的分析,下拉菜单选择相关,再点开双变量选项。这一步不用选其他复杂的单变量、偏相关功能,基础的双变量相关完全能满足绝大多数调研、课程作业的需求。把需要分析关联性的所有变量,全部从左侧栏移入右侧的变量框中,不用分批操作,一次性移入所有变量会自动生成相关矩阵。
勾选对应的检验参数是核心操作。默认的皮尔逊相关系数是连续变量的首选,直接保留勾选状态就行。然后一定要勾选双侧检验、标记显著性相关这两个选项。之前第一次操作时取消了标记显著性相关,最后输出的表格只有相关系数,没有星号标注,根本无法判断变量相关性是否显著,数据结果完全不具备参考价值。
点击确定后,系统会自动生成输出日志,完整的相关分析矩阵表格就出来了。表格里的数值分为两部分,一个是相关系数,数值区间在-1到1之间,正数代表正相关,负数代表负相关,数值绝对值越接近1,代表两个变量的关联程度越强。另一个是显著性数值,也就是P值,这是判断结果是否有效的关键标准。
很多人看完表格看不懂数据含义,白做了一遍分析。实操里只需要认准一个判定标准,显著性P值小于0.05,就代表两个变量存在显著的相关关系,数据结果成立。如果P值大于0.05,无论相关系数数值多大,都只能说明变量之间无显著相关性,所得结果不具备统计学意义。
偶尔会遇到数据输出异常的情况,矩阵表格里出现大量空值。排查后发现,是样本数据里存在大量缺失值、异常极值数据。SPSS在运算时会自动剔除异常样本,样本量不足就会导致运算失效。遇到这种情况,不用重新建模,直接回到数据视图,筛选并删除异常、缺失样本,重新运行一次双变量相关分析即可。
不用额外做复杂的美化和运算调整,基础相关分析的结果已经足够支撑常规数据分析需求。最后只需要直接复制输出的矩阵表格,整理到自己的数据分析报告里,搭配对应的变量关联解读就可以完成全部工作。