从一个小例子看贝叶斯公式的应用(学习简单、基础、入门的例子)

#从一个小例子看贝叶斯公式的应用

###应用Bayesian公式考察如下的实例并回答问题。

张某为了解自己患上了X疾病的可能性,去医院作常规血液检查。其结果居然为阳性,他赶忙到网上查询。根据网上的资料,血液检查实验是有误差的,这种实验有“1%的假阳性率和1%的假阴性率”(真的患病者得到阴性结果称为假阴性,未患病的人得到阳性结果称为假阳性)。即在得病的人中做实验,有1%的概率是假阴性,99%是真阳性。而在未得病的人中做实验,有1%的概率是假阳性,99%是真阴性。于是张某根据这种解释,估计他自己得了X疾病的概率为99%。张某的推理是,既然只有1%的假阳性率,那么,99%都是真阳性,那我已被感染X病的概率便应该是99%。

张某咨询了医生,医生说:“99%?哪有那么大的感染几率啊。99%是测试的准确性,不是你得病的概率。你忘了一件事:这种X疾病的正常比例是不大的,1000个人中只有一个人有X病。”

张某不放心,又做了一个尿液检查,进一步检查他患上了X疾病的可能性,其结果仍然为阳性,尿液检查的实验有“5%的假阳性率和5%的假阴性率”。

a)张某初始计算感染X病的概率是99%,问题出在哪?
b)张某在血液检查之后感染X病的概率是多少?
c)张某在血液和尿液检查之后得X病的概率是多少?
d)如果根据张某的家族遗传信息,他得X病的概率是百分之一,请问结合血液和尿液检查结果,张某得X病的概率是多少?

a) 在这个例子中,张某由于没有认识到X疾病在人群中的患病率对于自己患病率的影响,从而得出了错误的结论。换言之,虽然,真阳性率+假阳性率=100%,反问,难道所有人都是阳性吗?张某错误的结论建立在所有人都是阳性的基础之下。

b)那么张某在血液检查之后的患病率是多少呢?画一张图来说明问题。
《从一个小例子看贝叶斯公式的应用(学习简单、基础、入门的例子)》
由此,根据贝叶斯公式,可以计算张某在血液检查后患病的概率为:
P ( 患 / 阳 ) = P ( 患 ) ∗ P ( 阳 / 患 ) P ( 患 ) ∗ P ( 阳 / 患 ) + P ( 不 患 ) ∗ P ( 阳 / 不 患 ) = 99 % ∗ 1 / 1000 99 % ∗ 1 / 1000 + 1 % ∗ 999 / 1000 ≈ 9 % P(患/阳) = \frac{P(患)*P(阳/患)}{P(患)*P(阳/患)+P(不患)*P(阳/不患)}=\frac{99\%*1/1000}{99\%*1/1000+1\%*999/1000} \approx 9\% P(/)=P()P(/)+P()P(/)P()P(/)=99%1/1000+1%999/100099%1/10009%

c)在血液检查之后,我们算得了张某患病的概率,相对于原来的 1 / 1000 1/1000 1/1000,在检验血液阳性的条件下的患病的概率增加为了 9 % 9\% 9%。在这样的前题之下,我们又对张某的尿液进行检查,检验为阳性。那么此时患病的概率计算方式同前,只不过是患病的概率更新为了 9 % 9\% 9%。如图所示:
《从一个小例子看贝叶斯公式的应用(学习简单、基础、入门的例子)》

同样地,由贝叶斯公式,有:

P 尿 ( 患 / 阳 ) = P 尿 ( 患 ) ∗ P 尿 ( 阳 / 患 ) P 尿 ( 患 ) ∗ P 尿 ( 阳 / 患 ) + P 尿 ( 不 患 ) ∗ P 尿 ( 阳 / 不 患 ) = 95 % ∗ 9 % 95 % ∗ 9 % + 5 % ∗ 91 % ≈ 65 % P_尿(患/阳) = \frac{P_尿(患)*P_尿(阳/患)}{P_尿(患)*P_尿(阳/患)+P_尿(不患)*P_尿(阳/不患)}=\frac{95\%*9\%}{95\%*9\%+5\%*91\%} \approx 65\% P尿(/)=P尿()P尿(/)+P尿()P尿(/)P尿()P尿(/)=95%9%+5%91%95%9%65%

d) 根据张某的家族患病率,我们知道在没有任何先验信息的前题下张某的患病率为 1 % 1\% 1%而不是 1 / 1000 1/1000 1/1000,利用这个数值,重新进行以上的两步计算,即可知根据张某的家族遗传信息,结合血液和尿液检查结果,张某得X病的概率。计算如下:

P ( 患 / 阳 ) = P ( 患 ) ∗ P ( 阳 / 患 ) P ( 患 ) ∗ P ( 阳 / 患 ) + P ( 不 患 ) ∗ P ( 阳 / 不 患 ) = 99 % ∗ 1 / 100 99 % ∗ 1 / 100 + 1 % ∗ 99 / 100 ≈ 50 % P(患/阳) = \frac{P(患)*P(阳/患)}{P(患)*P(阳/患)+P(不患)*P(阳/不患)}=\frac{99\%*1/100}{99\%*1/100+1\%*99/100} \approx 50\% P(/)=P()P(/)+P()P(/)P()P(/)=99%1/100+1%99/10099%1/10050%
P 尿 ( 患 / 阳 ) = P 尿 ( 患 ) ∗ P 尿 ( 阳 / 患 ) P 尿 ( 患 ) ∗ P 尿 ( 阳 / 患 ) + P 尿 ( 不 患 ) ∗ P 尿 ( 阳 / 不 患 ) = 95 % ∗ 50 % 95 % ∗ 50 % + 5 % ∗ 50 % ≈ 95 % P_尿(患/阳) = \frac{P_尿(患)*P_尿(阳/患)}{P_尿(患)*P_尿(阳/患)+P_尿(不患)*P_尿(阳/不患)}=\frac{95\%*50\%}{95\%*50\%+5\%*50\%} \approx 95\% P尿(/)=P尿()P尿(/)+P尿()P尿(/)P尿()P尿(/)=95%50%+5%50%95%50%95%

这就是说,在家族患病率和两次检查这样的前题之下,两次利用贝叶斯公式计算知张某得病的概率高达95%。

    原文作者:传染病问题
    原文地址: https://blog.csdn.net/lusongno1/article/details/80156728
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞