Z检验
什么是 Z 检验?¶
Z 检验是一种统计检验,用于确定当方差已知且样本量较大时,两个总体均值是否存在差异。它也可以用于将一个均值与假设值进行比较。
数据必须近似符合正态分布,否则该检验无效。为了执行 Z 检验,需要计算方差和标准差等参数。
主要要点¶
- Z 检验是一种统计检验,用于确定当方差已知且样本量较大时,两个总体均值是否存在差异,或者将一个均值与假设值进行比较。
- Z 检验是针对符合正态分布的数据进行的假设检验。
- Z 统计量或 Z 分数是一个数字,表示 Z 检验的结果。
- Z 检验与 t 检验密切相关,但当实验的样本量较小时,最好执行 t 检验。
- Z 检验假设标准差已知,而 t 检验假设标准差未知。
理解 Z 检验¶
Z 检验也是一种假设检验,其中 Z 统计量服从正态分布。Z 检验最适合用于大于 30 的样本,因为根据中心极限定理,随着样本数量的增加,样本被认为近似服从正态分布。
在进行 Z 检验时,应说明原假设和备择假设以及显著性水平(alpha level)。应计算 Z 分数(也称为检验统计量),并说明结果和结论。Z 统计量或 Z 分数是一个数字,表示从 Z 检验得出的分数与总体均值相差多少个标准差。
可以作为 Z 检验进行的检验示例包括单样本位置检验、双样本位置检验、配对差异检验和最大似然估计。Z 检验与 t 检验密切相关,但当实验的样本量较小时,最好执行 t 检验。此外,t 检验假设标准差未知,而 Z 检验假设标准差已知。如果总体标准差未知,则假设样本方差等于总体方差。
单样本 Z 检验示例¶
假设一位投资者希望检验某只股票的平均每日回报率是否大于 3%。计算了 50 个回报率的简单随机样本,其平均值为 2%。假设回报率的标准差为 2.5%。因此,原假设是平均值等于 3%。
相反,备择假设是平均回报率大于或小于 3%。假设选择 0.05% 的 alpha 值进行双尾检验。因此,每个尾部有 0.025% 的样本,并且 alpha 值的临界值为 1.96 或 -1.96。如果 z 的值大于 1.96 或小于 -1.96,则拒绝原假设。
z 的值是通过从为检验选择的平均每日回报率值(在本例中为 3%)中减去观察到的样本平均值来计算的。接下来,将结果值除以标准差除以观察值的数量的平方根。
因此,检验统计量为:
投资者拒绝原假设,因为 z 小于 -1.96,并得出结论,平均每日回报率小于 3%。
T 检验和 Z 检验有什么区别?¶
Z 检验与 t 检验密切相关,但当数据由小样本量组成时(即小于 30),最好执行 t 检验。此外,t 检验假设标准差未知,而 Z 检验假设标准差已知。
何时应该使用 Z 检验?¶
如果总体标准差已知且样本量大于或等于 30,则可以使用 Z 检验。无论样本量如何,如果总体标准差未知,则应改用 t 检验。
什么是 Z 分数?¶
Z 分数或 Z 统计量是一个数字,表示从 Z 检验得出的分数与总体均值相差多少个标准差。本质上,它是一种数值测量,描述了一个值与一组值的均值之间的关系。如果 Z 分数为 0,则表示数据点的分数与平均分数相同。Z 分数为 1.0 表示该值与平均值相差一个标准差。Z 分数可以是正数或负数,正值表示分数高于平均值,负值表示分数低于平均值。
什么是中心极限定理 (CLT)?¶
在概率论的研究中,中心极限定理 (CLT) 指出,随着样本量的增加,样本的分布近似于正态分布(也称为“钟形曲线”),假设所有样本的大小相同,并且与总体分布形状无关。等于或大于 30 的样本量被认为足以让 CLT 准确预测总体的特征。Z 检验的准确性依赖于 CLT 的成立。
结论¶
Z 检验用于假设检验,以评估发现或关联是否具有统计学意义。特别是,它检验两个均值是否相同(原假设)。只有在总体标准差已知且样本量为 30 个数据点或更大时,才能使用 Z 检验。否则,应使用 t 检验。