查看原文
其他

干货丨数据分析之基础分析

萜妹 萜心话 2022-09-14

我们先回顾上周的内容。上周萜妹说希望能用通俗的语言,帮助小可爱们搭建数据分析的框架,并且告诉小可爱们要做成什么样,为什么要这么做,以及怎么做。


萜妹把需要做的数据分析分为了三个大类,分别是:数据有效性分析、样本基本描述、数据具体分析。

  • 数据有效性分析:信度检验、验证性因子分析、共同方法偏差检验。

  • 样本基础描述:描述性分析、相关分析。

  • 数据具体分析:回归分析、bootstrap法、简单斜率分析(涉及调节时使用)

注:以上为至少要完成的操作,面对特殊情况的额外操作,这里未提及。如无特殊情况,完成上述操作即可。


上周介绍了数据有效性,那我们这周接着继续吧~


本期推送目标:能理解、进行如下操作






描述性分析

【步骤目标】

描述被试的基本分布情况,并计算所有变量的均值与标准差。

来源:参考文献[1]

【步骤目的】

首先,它能让读者比较清晰的知道被试的特征。因为这些人口统计学变量对数据结果肯定有影响的。

  • 一个不一定恰当的比喻:你研究新生代员工的某些特征,结果被试年龄分布主要是在35岁以上,这就不贴切,对吧。

性别、年龄、学历和工作年限是最有可能影响结果的人口统计学变量,所以这四个基本都会控制,其他的就结合自己的研究再加~

另外,均值和标准差也是数据的基本指标。尤其是标准差,可以帮助我们判断数据的质量,如果标准差过大,那结果可能就有很大的误差。

  • 一个不一定恰当的比喻:有10个人进行数学考试,结果5个人0分、5个人满分,那拿他们的数学水平和其他变量做回归,是不是就很容易出现偏差。

【具体操作 / 数据解读 / 判断标准】

使用软件:SPSS

频率:【分析】-【描述统计】-【频率】;

均值/标准差:【分析】-【描述统计】-【频率】;

这数据就没什么好解读的了,计算出来在合适的地方汇报就好~


相关分析

【步骤目标】

计算各变量相关度,并绘制如下表格。注意,控制变量也要做相关分析!

来源:参考文献[1]

【步骤目的】

这其实也是描述变量质量,顺便也可以初步验证假设的。

【具体操作】

使用软件:SPSS

①【分析】-【相关】-【双相关(B)】;

②将目标题项从左侧拖入右侧项目框➔点击【确定】,得结果。

补充:可以在②之前,点击右侧【选项】,勾选【均值和标准差】,这样结果中也会报告。就可以不用单独进行均值和标准差的计算。

【数据解读】

这里萜妹要说一句:SPSS的得出来的表格,跟写文章时要汇报的表格不一样啊。

在我自己毕业的时候我就困惑过,人家的表格都是怎么来的。之前还天真的以为,软件给出的就是可以用的表格。后来才明白,表格都要自己画,软件能给的,只有表格里的内容。

【判断标准】

相关度具体多少好,这萜妹也给不出官方的标准,下面只讲讲自己的经验。

  • 如果自变量和结果变量相关,那说明二者应该是有关系的,可以初步证实假设,做回归也大概率会显著;

  • 如果两个变量相关度非常高,比如到0.9了,那其实这两个变量基本没差,做回归也是无意义的(不过一般这种情况,CFA也很难达到理想程度)

  • 如果两个变量不相关,也不是绝对,可能控制某个变量后,做回归还是有可能能显著的。


独立样本T检验+方差分析

这其实不完全属于数据基础分析,它也可以用来验证假设,尤其是在实验法之中。

萜妹把它放在这里是因为,萜妹在写心理学的毕业论文时,导师让我使用它来检验人口统计学变量是否对结果有影响。虽然一般使用问卷法的期刊论文都不会有这个部分,但是毕业论文它还是很有用的(既能做一些验证,又能凑字数)

另外就是,毕业论文其实也不都是做高大上或者是复杂模型,有的学弟学妹就是基于简单的分类变量(比如年龄、性别等等)来分析。相比于,仅仅用频率来描述,加上这个步骤可能会让文章看起来更有质量一点(也更好毕业一点),所以萜妹还是决定介绍它~

【步骤目标】

计算出相应的指标,在文中进行描述或制成表格。

(注:萜妹找了好久才找到有在期刊中画了表格的文章,所以两种检验各找到一篇我就放弃了。但是这些表格绝对不是唯一的模板,小可爱们还可以自行探索。)

单因素方差分析的语言描述,来源:参考文献[2]

单因素方差分析的表格

独立样本T检验的语言描述

独立样本T检验的表格,来源:参考文献[3]

【步骤目的】

检验分类变量对结果是否有影响。独立样本T检验只能用于二分变量,单因素方差检验则没有限制。

做实验中常用它们来检验操作是不是有效的。

  • 比如高低分组之后,差异就应该是显著的;

  • 如果是随机分组,那差异则应该是不显著。

问卷操作中,也有可以用到的地方。

  • 比如,你要研究的是公务员balabala,但是你的被试既有公务员又有企业员工,那么就可以使用【行业】对结果变量进行独立样本T检验,如果二者对结果变量没有差异,就能说明你的操作是可接受的。

  • 再比如,你想知道东部、中部、西部的朋友吃辣水平会不会不一样,就可以用方差检验。如果不显著,就是水平一样,显著的话还可以看具体哪里更能吃辣。

【具体操作】

独立样本T检验

使用软件:SPSS

①【分析】-【比较均值】-【独立样本T检验】;

②将结果变量和分组变量从左侧拖入右侧变量框;

此时,性别后括号内为??,无法选定【确定】。

③点击【定义组】➔在组1与组2出填上问卷中对应的选项➔点击【继续】,此时【确定】键将变为可选状态,➔点击【确定】。

单因子方差分析

使用软件:SPSS

①【分析】-【比较均值】-【单因素ANOVA...】;

②将结果变量和分组变量从左侧拖入右侧变量框➔选择右侧的【两两比较(H)】;

③勾选【LSD(L)】➔点【继续】➔点【确定】。

【数据解读 / 判断标准】

独立样本T检验

如果【方差方程的Levene检验】的结果(①)不显著,则符合方差齐性的假设,按第一行的T检验结果(②)报告;反之,则拒绝方差齐性的假设,按第二行的结果(③)报告。示例图中应按第二行的结果报告。

单因子方差分析

首先关注显著性,显著则代表有明显差异。当存在差异时,均值差大于0表示前者大于后者,反之则小于。



啦啦啦,这篇推送还是秉承着之前的原则,想让没有基础的小可爱们真正的去理解,每一步的意义和目的。希望这真的能对小可爱们有所帮助。如果有什么建议或者问题,也可以留言跟萜妹反馈哦~


另外,萜妹用的是SPSS20的版本,有些说法可能和现在的版本不一样。但是位置一般没变,小可爱们可以对照位置查看。


之后,由于赶不上今年毕业小可爱们的进度(怪萜妹自己恢复更新太晚),萜妹就决定数据分析写慢点、再写细一点,于是这篇推送的后半部,没有强行把假设检验也写进去。毕竟关于假设部分,萜妹想从什么是中介和什么是调节开始说起,篇幅会很长,还是下周单独写吧~


小可爱们,我们下周见吧~


最后,说个题外话。最近来了很多新朋友,总觉得是某些不知名小可爱把萜妹分享到了什么群中,萜妹在此感恩!


参考文献:

[1]马君,闫嘉妮.正面反馈的盛名综合症效应:正向激励何以加剧绩效报酬对创造力的抑制?[J].管理世界,2020,36(01):105-121+237.    

[2]黄苏萍,马姗子,刘军.霹雳手段还是菩萨心肠?刻板印象下企业家领导风格与产品质量感知关系的研究[J].管理世界,2019,35(09):101-115+194+199-200.

[3]张奇林,周艺梦.中国城镇低龄退休老年人工作与幸福感的关系[J].心理学报,2017,49(04):472-481.


往期推送

➪干货丨数据分析之有效性分析

➪干货丨Mplus基础使用指南

➪干货丨论文写作常用数据分析

➪干货丨论文写作常用假设分析

➪干货丨SPSS数据分析之分析篇




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存