卡方检验(Chi-Square Test),是假设检验的一种,属于非参数检验。它是比较两个分类变量之间的关系而进行的统计检验。通常将观测值与理论值之间的偏离程度用卡方统计量来度量,进而推断两个分类变量之间是否存在相关性、相关强度和适合度等。
卡方检验广泛应用于统计学、生物学、经济学等领域中,如:在医学调查中用卡方检验测定某种治疗方法的有效性;在经济学研究中用卡方检验检验两个事件是否有关联;在市场营销中可通过卡方检验来研究客户的购买意愿与不同特征变量的相关性等。
卡方检验的计算非常繁琐,但是我们可以通过Excel来快捷地进行计算,下面以Excel的示例为例进行介绍:
对于样本数据:深圳市某工厂的各车间产量(单位:台),如下表:
工厂名称 | 年产量(台) | 合计 | |||
2015 | 2016 | 2017 | 2018 | ||
一车间 | 200 | 220 | 230 | 240 | 890 |
二车间 | 180 | 200 | 210 | 230 | 820 |
三车间 | 160 | 180 | 190 | 200 | 730 |
四车间 | 150 | 170 | 180 | 190 | 690 |
我们可以通过Excel中卡方检验函数“CHITEST”来进行计算:
通过卡方检验结果,我们可以得出结论:这4个车间各年产量分布符合正态分布。