
3.1 贝叶斯法则及其应用
首先,我们回顾一下条件概率公式,假设在某一条件H发生的条件下,求任意另一事件E发生的概率,可以用如下公式表示:

我们称P(E|H)为事件H发生的条件下,事件E的概率。其中

将式(3.1)改写成

式(3.3)称为概率的乘法公式。
假设事件H1,H2,…,Hn的并集是整个样本空间,即H1,H2,…,Hn是事件H的一个划分,则任一事件E可以表示为E与所有假设事件Hj交集的并集。

因为各EHj是互斥的,所以可以把各EHj所对应的事件概率求和:

在式(3.3)中,用Hj代替H,并对所有的j求和,有:

式(3.6)称为全概率公式。
在贝叶斯推理中,我们主要关心的是,在给定证据E的情况下,假设事件Hi发生的概率。这可以用下面的公式来表达:

将式(3.3)和式(3.6)代入式(3.7)中,就导出了贝叶斯推理法则:

式中,P(Hi|E)为在给定证据E的情况下,假设事件Hi发生的概率;P(E|Hi)为假设事件Hi发生的条件下,任一事件E出现的概率;P(Hi)为假设事件Hi发生的先验概率;为出现任一事件E的全概率,即在各种假设事件Hi都可能发生的情况下,出现E的概率和。
例3.1 某工厂有4条流水线生产同一种产品,4条流水线的产量分别占总产量的15%、20%、30%、35%,且这4条流水线的不合格品率依次为0.05、0.04、0.03及0.02。
(1)现在从该厂产品中任取一件,问恰好抽到不合格品的概率为多少?
(2)若该厂规定,出了不合格品要追究有关流水线的经济责任。在出厂产品中任取一件,结果为不合格品,但该件产品是哪一条流水线生产的标志已脱落,问厂方如何处理这件不合格品比较合理?第4条流水线应该承担多大责任?
解(1)假设:A={任取一件,恰好抽到不合格品},Bi={任取一件,恰好抽到第i条流水线的产品},i=1,2,3,4
于是,由全概率公式可得

由题意可知,P(A|Bi)分别为0.05、0.04、0.03及0.02。在实际问题中,这些数据可以从过去生产的产品中统计出来。
(2)从贝叶斯推理的角度考虑,可以根据P(Bi|A)的大小来追究第i条流水线的经济责任。如对于第4条流水线,由贝叶斯公式可知:

而P(A|B4)P(B4)=0.02×0.35=0.007,从而得。由此可知,第4条流水线应负22.2%的责任。同理,可以计算出第1、2、3条流水线分别负23.8%25.4%和28.6%的责任。
同样,我们可以用来自两个传感器的不同类型的测量数据提高矿物的检测率,见下面的例子。
例3.2 金属检测器(MD)能检测出大于1cm且只有几克重的金属碎片的存在,地下探测雷达(GPR)能利用电磁波的差异从土壤和其他背景中发现大于10cm的物体。金属检测器只能简单地区分物体中是否含有金属,而地下探测雷达却具有物体地分类功能,因为它能对物体地多个属性有所响应,如尺寸、形状、物体类型及内部结构等。试验证通过融合来自两个传感器的数据就可以提高对矿物的检测率,这些传感器能够响应各独立物理现象所产生的信号。
解 可以用贝叶斯推理来计算被测物体是属于哪类的后验概率。因为这里主要检测矿物,所以简单地将物体的类别限定为矿物和非矿物。设矿物类为O1,非矿物类为O2,并且做如下假设:
P(O1)=0.2,即物体为矿物的概率为0.2
P(O2)=0.8,即物体为非矿物的概率为0.8
其中,定义金属检测器和地下探测雷达这两个传感器所观测到的数据,1:代表矿物,0:代表非矿物。
再进一步假设:
P MD(1|O1)=0.8
P MD(1|O2)=0.1
P GPR(1|O1)=0.9
P GPR(1|O2)=0.05
用贝叶斯方法来进行数据融合的过程如图3.1所示。

图3.1 两类(MD/GPR)传感器的数据融合过程
因为两类传感器产生的信号相互独立,所以传感器联合报表概率为

其中,i分别为MD和GPR。
利用贝叶斯法则来计算物体是第j类物品的后验概率为

其中,P(数据)=∑[P(数据|Oj)P(Oj)]为全概率公式。
当观测到的数据为(1,1)时,计算可得:
P(1,1|O1)=PMD(1|O1)PGPR(1|O1)=0.8×0.9=0.72
P(1,1|O2)=PMD(1|O2)PGPR(1|O2)=0.1×0.05=0.005

P(O2|1,1)=0.027
所以,根据贝叶斯推理可知,当观测到的数据为(1,1)时,可以判断该物质类型为矿物。
当观测到的数据为(1,0)时,计算可得:
P(1,0|O1)=PMD(1|O1)PGPR(0|O1)=0.8×0.1=0.08
P(1,0|O2)=PMD(1|O2)PGPR(0|O2)=0.1×0.95=0.095

P(O2|1,0)=0.8261
P(O2|1,0)>P(O1|1,0)
所以,根据贝叶斯推理可知,当观测到的数据为(1,0)时,可以判断该物质类型为非矿物。