统计假设是关于总体参数的假设。这个假设可能是真的,也可能不是。假设检验是指统计学家用来接受或拒绝统计假设的正式程序。
统计假设检验
确定统计假设是否正确的最佳方法是检查整个人群。由于这通常不切实际,研究人员通常会随机检查总体样本。如果样本数据与统计假设不一致,则拒绝该假设。
有两种类型的统计假设。
零假设。零假设,用 H o表示 ,通常是样本观察结果纯粹是偶然的假设。
备择假设。备择假设(用 H 1 或 H a表示 )是样本观测值受到某些非随机原因影响的假设。
例如,假设我们想确定一枚硬币是否公平和平衡。零假设可能是一半的翻转结果是正面,一半是反面。另一种假设可能是正面和反面的数量会有很大不同。象征性地,这些假设可以表示为:
H o : P = 0.5 H a : P ≠ 0.5
假设我们抛硬币 50 次,结果是 40 个正面和 10 个反面。鉴于这个结果,我们倾向于拒绝原假设。根据证据,我们得出的结论是,该代币可能不公平和平衡。
我们可以接受原假设检验吗?
一些研究人员表示,假设检验可能有两种结果之一:接受原假设或拒绝原假设。然而,许多统计学家不同意“接受零假设”的概念。相反,他们说:你拒绝原假设,或者你 克罗地亚数据 不拒绝原假设。为什么要区分“接受”和“未能拒绝”?接受意味着原假设为真。未能拒绝意味着数据没有足够的说服力让我们更喜欢备择假设而不是原假设。假设检验
假设检验
统计学家遵循正式流程,根据样本数据确定是否拒绝原假设。这个过程称为假设检验,由四个步骤组成。
陈述假设。这涉及陈述原假设和替代假设。这些假设以相互排斥的方式提出。也就是说,如果一个是真的,另一个就一定是假的。
制定分析计划。分析计划描述了如何使用样本数据来评估原假设。评估通常围绕单个检验统计数据。
分析样本数据。查找分析计划中描述的检验统计量的值(平均得分、比例、t 统计量、z 得分等)。
解释结果。应用分析计划中描述的决策规则。如果基于原假设检验统计量的值不太可能,则拒绝原假设。
决策失误
假设检验可能会导致两种类型的错误:
I 类错误。当研究人员拒绝原假设(当原假设为真时)时,就会发生第一类错误。犯第一类错误的概率称为 显着性水平。该概率也称为 alpha,通常用 α 表示。
II 类错误。当研究人员未能拒绝错误的零假设时,就会发生第二类错误。犯第二类错误的概率称为 Beta,通常用 β 表示。不犯第二类错误的概率 称为检验的功效。
决策规则
分析计划包括拒绝原假设的决策规则。在实践中,统计学家以两种方式描述这些决策规则——参考 P 值或参考接受区域。
P 值。假设检验统计量等于 S,则 支持原假设的证据强度。 P 值是 假设假设为真,观察到与S一样极端的检验统计量的概率 。如果 P 值小于显着性水平,我们拒绝原假设。
受理区域。接受区域是一个值的范围。如果检验统计量在接受区域内,则不会拒绝原假设。定义接受区域,使发生 I 类错误的机会等于显着性水平。
接受区域之外的一组值称为拒绝区域。如果检验统计量落入拒绝域内,则拒绝原假设。在这种情况下,我们说假设在显着性水平 α 上被拒绝。
这些方法是等效的。一些统计文本使用 P 值方法,其他统计文本使用接受区域方法。在这个网站上,我们倾向于使用接受区域的方法。
一尾和双尾检验
对统计假设的检验(其中拒绝区域仅位于抽样分布的一侧)称为单尾检验。例如,假设原假设指出均值小于或等于 10。备择假设是均值大于 10。拒绝区域将由位于采样右侧的一系列数字组成分布,即一组大于 10 的数字。
对统计假设的检验(其中拒绝区域位于抽样分布的两侧)称为双尾检验。例如,假设原假设指出均值等于 10。备择假设是均值小于 10 或大于 10。拒绝区域将由位于样本两侧的一系列数字组成分布,即拒绝区域将部分由小于 10 的数字和部分大于 10 的数字组成。