

6.2 假设检验
所谓假设检验就是根据样本的信息来判断总体分布是否具有指定的特征。例如,已知样本来自正态总体,那么是否能说明它是来自均值等于 的正态分布呢?又如,已知两个相对独立的样本分别来自两个正态分布,那么是否能说这两个总体的均值相同,或方差相同?……这些都属于假设检验问题。 处理假设检验问题的一般步骤是: 根据实际问题的要求,提出原假设 及备择假设 。 给定显著性水平 和样本容量n( 的值视具体情况而定,通常取0.1、0.05、0.01及0.005等值)。 确定检验统计量和拒绝域的形式。 按 求出拒绝域。 根据样本观测值所求出的统计量确定是接受还是拒绝原假设 。
6.2.1 基于成对数据的t检验
有时为了比较两种产品、两种仪器、两种方法等的差异,常在相同的条件下作对比试验,得到一批成对的观察值,然后分析观察数据作出推断。这种方法被称为逐对比较法。在假设检验中利用t统计量进行检验,因而称为基于成对数据的t检验或成对观测值t检验。 1. 成对数据t检验的基本理论 例如,要分析一种新体育疗法是否对减肥具有显著作用。现随机抽取了12位病人进行试验,试验前后测得体重如下:
假设治疗前后,除参加了这种新体育疗法外,其余的一切条件都尽可能做到相同。问根据试验结果,能否判断这种新体育疗法对减肥具有显著作用? 本例就属于成对观测值t检验问题。对于这类假设检验,理论上是这样处理的。 先由n对观测值之差构成成对观测样本 ,其中 , 为试验前的观测样本, 为试验后的观测样本。 假设 来自正态总体 ,这里 均属未知。若新体育疗法对体重没有什么影响,则治疗前后各对数据的差异 属随机误差。而随机误差可以认为服从均值为0的正态分布。因此检验新体育疗法是否对减肥具有显著作用,就归结为在显著性水平 下,检验假设: : (即 ) : (即 ) 检验统计量为服从t分布的统计量: 检验的拒绝域:对于给定的 ,当 时拒绝假设 其中: 为试验前观测样本 的均值, 为试验后观测样本 的均值, 为成对观测样本 的均值; 和 分别为成对观测样本 的样本均值和样本方差。 2. 成对数据的均值差检验 从上面的分析可知,要进行成对观测值t检验,需要大量的计算和查表。现利用Excel 2000提供的t-检验:平均值的成对二样本分析工具,可以迅速地得到检验结果。其具体操作步骤是: 先将观察数据输入工作表中。 选择工具菜单中的数据分析命令,这时弹出数据分析对话框。 在分析工具列表中,选择t-检验:平均值的成对二样本分析工具,单击确定按钮。 此时将弹出t-检验:平均值的成对二样本分析对话框,如图6-6所示。 图6-6 在输入框中指定输入参数。 变量 1 的区域:指定试验前的数据区域,本例输入A1:A13。 变量 2 的区域:指定试验后的数据区域,本例输入B1:B13。 假设平均差:根据实际问题,假设成对观测样本 的均值 。本例假设样本 与样本 的平均值相等,所以输入0。 标志复选框:由于所输入的数据区域包含标志行,所以选中标志复选框。 值:根据需要指定显著性水平。本例输入0.05。 在输出选项框内指定输出选项。本例选定输出区域,再输入输出区域的左上角单元格地址D1。 单击确定按钮。 该问题的原始数据及检验结果如图6-7所示。
治疗前x
133
145
100
156
127
122
142
110
136
166
138
110
治疗后y
120
122
105
133
108
110
135
105
122
145
128
108
图6-7 分析检验结果可以看出,样本的t统计量等于4.74566402,大于t双边临界值2.20098627,即 ,所以拒绝原假设H0,即在置信度为0.05的情况下,新体育疗法前后的数据有显著差异。因此,可得出结论:这种新体育疗法对于95%以上的人具有减肥作用,疗效显著。