Python P值

2024年4月25日 377次阅读来源: Python数据科学

p值是关于假设的强度。我们基于一些统计模型建立假设，并使用p值比较模型的有效性。获得p值的一种方法是使用T检验。

这是对零假设的双侧检验，即独立观察值'a'的样本的期望值(平均值)等于给定的总体均值popmean。看看下面的一个例子。

from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print (stats.ttest_1samp(rvs,5.0))

执行上面示例代码，得到以下结果 –

Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

比较两个样本

在下面的例子中，有两个样本可以来自相同或不同的分布，想要测试这些样本是否具有相同的统计特性。

ttest_ind – 计算两个独立样本得分的T检验。对于两个独立样本具有相同平均(预期)值的零假设，这是一个双侧检验。该测试假设人口默认具有相同的差异。

如果观察到来自相同或不同人群的两个独立样本，那么可以使用这个测试。让我们来看下面的一个例子。

from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print (stats.ttest_ind(rvs1,rvs2))

执行上面示例代码，得到以下结果 –

Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)

可以使用相同长度的新数组进行测试，但具有不同的含义。在loc中使用不同的值并测试相同的值。

    原文作者：Python数据科学
    原文地址: https://www.yiibai.com/python_data_science/python_p_value.html
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。