PHP前端开发

如何在Python中执行Brown-Forsythe检验

百变鹏仔 3小时前 #Python
文章标签 如何在

brown-forsythe 检验是一种统计检验,用于确定两个或多个组的方差是否相等。 levene 检验使用与均值的绝对偏差,而 brown-forsythe 检验则使用与中位数的偏差。

检验中使用的原假设如下 -

H0:组(总体)的方差相等

备择假设是方差不相等 -

H1:组(群体)的方差不相等

立即学习“Python免费学习笔记(深入)”;

为了执行测试,我们计算每组的中位数以及与中位数的绝对偏差。然后我们根据这些偏差的方差计算 F 统计量。假设计算出的 F 统计量大于 F 分布表中的临界值。在这种情况下,我们拒绝原假设并得出结论:各组的方差不相等。

在 Python 中,scipy 和 statsmodels 库提供了执行 Brown-Forsythe 测试的方法。

值得注意的是,Brown-Forsythe 检验对异常值很敏感,但对非正态性比 Levene 检验更稳健。如果数据不正常,一般建议使用Brown-Forsythe检验。

Python 中的 Brown ñ Forsythe 测试

语法

levene(sample1, sample2, …sampleN, center=’median’, proportiontocut=0.05)

参数

  • sample1、sample2、…sampleN - 样本数据,可能有不同的长度。样品必须只有一维才能被接受。

  • Center - 用于测试的数据函数。 “中位数”是默认值。

  • Proportiontocut - 当中心被“修剪”时,会指示从每一端删除的数据点数量。

说明

levene()函数中,用户必须传递不同长度的一维样本数据以及参数中心作为“Median”。然后,该函数返回所提供样本的统计数据和 p_value。

算法

  • 从 scipy 导入 levene 函数。

  • 创建要执行 Brown-Forsythe 测试的数据样本。

  • 将示例数据传递给 levene 函数以执行测试。

  • 从函数返回统计数据和 p_value。

您可以使用统计数据。 scipy 库中的 Levene 方法用于执行 Brown-Forsythe 测试。

from scipy.stats import levenegroup1 = [1, 2, 3, 4, 5]group2 = [2, 3, 4, 5, 6]group3 = [3, 4, 5, 6, 7]statistic, pvalue = levene(group1, group2, group3)print("statistic: ", statistic)print("p-value: ", pvalue)

输出

statistic:  0.0p-value:  1.0

在这里,您可以看到 p 值为 1,大于 0.05。这意味着我们可以接受原假设。因此,两组的方差相同。因此,替代假设被拒绝。

除了实施 Brown-Forsythe 问题之外,我们还需要澄清机器学习工程师通常会遇到的一个困惑。这就是 Brown-Forsythe 和 ANOVA 检验相互关联的方式。

Brown ñ Forsythe 检验和 ANOVA 检验有何相关性?

Brown-Forsythe 和 ANOVA(方差分析)检验是相关的,因为它们检验组均值的差异。然而,它们测试不同的假设并具有不同的应用。

方差分析是一种统计方法,用于检验两个或多个组的均值之间是否存在显着差异。它假设各组的方差相等并且数据呈正态分布。方差分析用于确定两个或多个组的均值是否相等,并比较各组的方差。

Brown-Forsythe 检验是 Levene 检验的变体,后者使用与均值的绝对偏差,而 Brown-Forsythe 检验则使用与中位数的偏差。另一方面,Brown-Forsythe 检验是方差齐性检验,这是方差分析的必要假设。用于判断两个或多个组的方差是否相等。

在实践中,通常在方差分析之前执行 Brown-Forsythe 检验来检查是否满足等方差假设。如果方差不相等,则可能适合使用非参数检验(例如 Kruskal-Wallis 检验或 Welch 方差分析检验)来代替常规检验。

Brown ñ Forsythe 测试用例

Brown-Forsythe 检验用于生物学、医学、心理学、社会科学和工程学等各个领域,用于检验不同组中的等方差。一些常见的用例包括 -

  • 比较两个或多个样本的方差 - Brown-Forsythe 检验可以确定两个或多个样本的方差是否相等。例如,在医学研究中,该测试可用于比较不同患者组的血压测量值的方差。

  • 在执行方差分析之前测试方差同质性 - 由于 Brown-Forsythe 检验是方差同质性测试,因此可用于检查是否满足等方差假设在执行方差分析之前。这确保了方差分析的结果是有效的。

  • 非正态分布数据中的等方差检验 - Brown-Forsythe 检验对于非正态性比 Levene 检验更稳健。它可用于检验非正态分布数据中的等方差。

  • 比较重复测量设计中的方差 - 使用重复测量设计进行实验时,使用 Brown-Forsythe 检验来检查组间方差的同质性非常有用。

  • 制造中的质量控制 - Brown-Forsythe 测试可用于检查不同生产批次中的等方差,以确保产品质量一致。

结论

总之,Brown-Forsythe 检验是一种有用的统计方法,用于检测数据集中是否存在异方差性。它可以使用 scipy 库在 Python 中轻松实现。测试结果可以为有关对数据执行适当统计分析的决策提供信息。通过了解测试的假设并解释结果,研究人员可以更好地了解数据的分布并就其分析做出明智的决策。