当前位置: 首页 >> 学术快递 >> 正文

T检验:从理解到应用

发布者: [发表时间]:2019-07-05 [来源]:量化研究方法 [浏览次数]:

通常我们实际工作面对的数据差异性并不是那么显著,而为了消除人为的主观臆断,就不得不引入统计检验。T检验是一种常用作均值判断的统计检验方法,Excel数据分析加载项和SPSS会是我们经常使用的工具,在下面会给出两种工具对应的实际操作步骤。


单样本T检验:常用于样本均值与总体均值的比较。

独立样本T检验:常用于两个独立样本之间均值的比较。

配对样本T检验:常用于在某种程度上相关的两个样本之间均值的比较。这个某种程度相关,主要对应有这么两种形式:同一样本在不同时刻产生的结果(比如同一个活动页采用前后采用两种引流策略)或两个紧密联系的样本分别测量产生的结果(比如双胞胎的IQ测试)。


单样本T检验-SPSS


操作步骤(原假设:样本均值=总体均值,其中总体均值由我们事先指定):


  1. 分析->比较平均值->单样本T检验

  2. 将需要检验的变量移入“检验变量”框

  3. 在“检验值”框输入原假设中的指定值

  4. 点击“确定”

  5. 【结果解释】关注“单样本检验”结果输出表,如果“显著性”(即P值,以下均记作P值,此处我们只关注双尾,下同)≤0.05(注:我们统一使用0.05,下同),拒绝原假设,即样本均值不等于总体均值,比较样本均值和总体均值,表明样本均值是大于还是小于总体均值;如果P值>0.05,则接受原假设,及样本均值和总体均值没有显著差异。


独立样本T检验-SPSS


操作步骤(原假设:样本1均值=样本2均值):


  1. 分析->比较平均值->独立样本T检验

  2. 将需要检验的变量移入“检验变量”框

  3. 将分组变量移入“分组变量”框,在“定义组”中分别输入两个样本组的标识信息

  4. 点击“确定”

  5. 【结果解释】关注“独立样本检验”结果输出表,需要分成“已假设方差齐性”和“未假设方差齐性”两行结果来看,我们使用哪一行的结果取决于这里面包含的一层方差齐性检验。我们首先需要关注“方差相等性检验”的P值,如该P值≤0.05,即两个样本方差不等,则需要关注“未假设方差齐性”这一行的结果,否则需要关注“假设方差齐性”这一行的结果。确定该关注哪一行的结果后,再关注“平均值相等性的T检验”中的P值,同样是根据P值与0.05的关系来决定接受或拒绝原假设。


独立样本T检验-Excel数据分析加载项


操作步骤(由于Excel加载项没有集成“方差相等性”检验,因此需要分两步):


  1. F检验:双样本方差操作步骤(原假设:样本1方差=样本2方差):

  2. 数据->数据分析->F检验:双样本方差

  3. 选择变量1、变量2对应的区域(如变量名称位于所选区域的第一个单元格,还需要勾选“标志”,下同)

  4. 选择输出区域

  5. 点击“确定

  6. 【结果解释】如P值≤0.05,则拒绝原假设,即样本1方差≠样本2方差;否则,接受原假设。根据a)的结果,如样本1方差=样本2方差,则选择“t检验:双样本等方差假设”;否则,选择“t检验:双样本异方差假设”(原假设:样本1均值=样本2均值):


T检验:双样本等/异方差检验(原假设:样本1均值=样本2均值):


  1. 数据->数据分析->t检验:双样本等方差假设或 t检验:双样本异方差假设

  2. 选择变量1、变量2对应的区域

  3. 在“假设平均差”框输入期望中的样本均值的差值,缺省时为0,对应样本均值相同

  4. 选择输出区域

  5. 点击“确定”

  6. 【结果解释】如P值≤0.05,则拒绝原假设,即样本1均值≠样本2均值;否则,接受原假设。


配对样本T检验-SPSS操作步骤


(原假设:样本1均值=样本2均值)


  1. 分析->比较平均值->单样本T检验

  2. 将需要检验的2个变量移入“成对变量”框

  3. 点击“确定”

  4. 【结果解释】如P值≤0.05,则拒绝原假设,即样本1均值≠样本2均值;否则,接受原假设


配对样本T检验-Excel数据分析加载项


操作步骤(原假设:样本1均值=样本2均值)


  1. 数据->数据分析->平均值的成对二样本分析

  2. 选择变量1、变量2对应的区域

  3. 选择输出区域

  4. 点击“确定”

  5. 【结果解释】如P值≤0.05,则拒绝原假设,即样本1均值≠样本2均值;否则,接受原假设。


应用场景举例:


  1. 前后采用两种运营策略给店铺带来的销售额对比。可以采集两种运营策略带来的店铺销售额(此处只是用作举例,不具备实际操作意义),做配对样本T检验。

  2. 两个付费渠道的ROI对比分析。可以采集两个付费渠道的历史ROI数据,然后做独立样本T检验。