2022-9-5
条件概率,顾名思义,就是附加条件后的概率,对于两个事件A和B,P(A|B)表示已知B事件发生的情况下,A事件发生的概率,对应的数学定义的表达式是:
P(A|B) = P(AB)/P(B)
前段时间集思录上有帖子讨论三盒问题(https://www.jisilu.cn/question/462741),我直接借用过来:
三个相同的盒子里各有2个球,其中一个盒子里放了2个红球,一个盒子里放了2个蓝球,一个盒子里放了红球和蓝球各1个。随机选择一个盒子后从中随机摸出一球是红球,则这个盒子里另一个球是红球的概率为:
A 1/4 B 1/2 C 3/4 D 4/5 E 2/3
首先,我想说一个问题,特别是数学问题,采用描述性的解法并不适合讨论。因为题目是一段描述,不同的人甚至产生了不同的理解,然后如果解题仍是一种描述,其中某些步骤可能是不严谨或是数学上错误的,同时采用大量的类比,可能讨论的也并不是一个问题。最终就是鸡同鸭讲,浪费时间。我建议对于这些问题,还是翻译成更严谨的数学表达。然后出错了一般会在2个方面。要么是题目翻译成数学表达时出现了偏差,或者是数学推导中出现了错误。这样讨论起来会更有效率。
对于三盒问题,我的翻译:
总共有5个可描述的事件:
A1:{取了双蓝的盒子},A2:{取了双红的盒子},A3:{取了蓝红的盒子} 其中P(A1)=P(A2)=P(A3)=1/3
B1:{取到第1个球为红球};B2:{取到第2个球为红球}; 用全概率公式可知 P(B1) = P(B2) = 1/2
那么这个问题就是求解:P(B2|B1)
根据条件概率公式 P(B2|B1) = P(B1B2)/P(B1)
由于A类事件是一个“完备事件群”(事件集合两两互斥且至少发生一个),故可用全概率公式把P(B1)用基于A事件各种情况的条件概率之和来表达(其实很好理解,就是大家的直觉,类似于决策树):
即:P(B1) = P(B1|A1)P(A1) + P(B1|A2)P(A2)+ P(B1|A3)P(A3)
其中P(B1|A1) = 0, P(B1|A2) =1 ,P(B1|A3) = 1/2
代入,得到P(B1) = 1/2
而B1B2同时发生这个事件,只是A2事件的不同描述方法。所以P(B1B2)=P(A2)=1/3
最终得到P(B2|B1) = P(B1B2)/P(B1) = (1/3)/(1/2) = 2/3
对于这个答案,有不同意见的话,可以从两方面反驳,比如我翻译成数学语言错了,或者我后面数学推导哪一步错了或者不严谨。这样讨论才有意义。
当然,得出这个答案只是一方面,那么那些“错误”的答案是如何得来的呢?可能我们也需要同样的关心,这样可以更深入的了解这些概念,往往从错误中才能学到更多。所以,我翻看了所有和2/3答案不同的且有分析过程的回复,试图用数学语言精确的指出可能的问题所在。
(答案是C:3/4)的解释:
拿出第一颗是红球,说明抽中两个都是红球盒子的概率是75%, 一红一蓝是25%,两个蓝色盒子是0%,那么下一个是红球的概率 = 0.75 * 100% + 0.25 * 0% = 0.75。拿到A2的概率要高一些,拿到A2概率=(1.00 + 0.50) / 2 = 0.75,拿到A3的概率就是0.25。
翻译一下:由P(A2|B1)=0.75 ,P(A3|B1) = 0.25, P(A1|B1) = 0, 可得
P(A2|B1) P(B2|A2B1) + P(A3|B1)*P(B2|A3B1) = 3/4
这里面P(A2|B1)应该计算错了,仅用条件概率公式可得:
P(A2|B1)=P(A2B1)/P(B1) = 2/3 , P(A3|B1)=P(A2B1)/P(B1) = 1/3, P(A1|B1) = 0
而P(B2|B1)=P(A2|B1) = 2/3, 也就是说B2|B1与A2|B1是同一个事件的不同描述而已。
(答案是B:1/2)的解释。
1.抽出红球,就把两个都是蓝球的盒子排除了。
排除全蓝盒子没错,剩下的盒子等概率错了。这种说法是把古典概率的前提条件搞错了,确实B1事件为条件时,P(A1|B1) =0被排除了, 但P(A2|B1)和P(A3|B1)并不是等可能的,不能简单的认为是55开的概率,实际是2/3与1/3的关系。
2.这个盒子里只剩1个球,不是蓝就是红
确实非蓝即红,但概率不同,篮球1/3,红球2/3。不是出现几种情况都必然等概率的。2颗骰子能出2~12共11种点数,但2只有1/36,而7有1/6的概率。
(答案是1/3)的解释:
1.为啥我觉得答案是p=1/3*1+1/3*0=1/3。
我补充下,大概是认为1/3*1+1/3*0 = P(A2)*1 + P(A3)*0 + P(A1)*0 = P(A2)*P(B2|A2B1) = P(B2|B1)
这个问题出在在等式的最后一步不成立。
按全概率公式,有:
P(B2|B1) = P((B2|B1)|A1)*P(A1) + P((B2|B1)|A2)*P(A2) + P((B2|B1)|A3)*P(A3)
P((B2|B1)|A2) = 1, P((B2|B1)|A3) = 0 但P((B2|B1)|A1)*P(A1) = ?
这种答案的误区是认为P((B2|B1)|A1)=0,发生了A1的情况下,B1就不可能发生,所以在一个不可能事件条件下一个不可能事件的发生概率,感觉就没有意义,按之前的计算看,如果等式成立,反而是P((B2|B1)|A1)=1。(不过我还没学到这种条件概率(P(A|B),P(B)=0)的处理方法,据说是可以用极限的方法来求,欢迎老师们补充)
2.这是独立随机事件,前面的操作并不影响后面事件的概率,所以其实题目就是求连续摸出2个红球的概率,那就是求选中两个红球盒子的概率,所以答案当然就是1/3.
题目在问P(B2|B1), B|B1和A2|B1是一个事件的不同描述,但和A2不是。P(A2|B1) = P(A2)仅在B1与A2独立时成立,而常识告诉我们,B1和A2显然是不独立的。知不知道B1显然会影响A2的概率,因为B1排除了A1。
其他一些回复
这不是数学题,而是语文阅读理解题。这样改一下提问大家的答案估计就没什么争议了:
1.如果提问改为:“小明摸出一个球发现是红球后,问小红另一个球是红球的概率是多少”,此时答案为二分之一。
2.如果提问改为:“小明还没摸球前问小红,当他摸出一个球为红球时另一个球也是红球的概率是多少”,此时答案为三分之二。
前者再问 P(B2|B1) 答案应该是2/3. 后者我理解是想表达摸出2个红球的概率是多少,即P(B1B2)答案应该是1/3。这种对于翻硬币来说,每一步出结果后下一步都是独立的,概率都不变,而把N次投硬币的结果择时概率相乘。这种做法是每一步都是独立的,而三盒问题中抽盒子和选球显然不是独立的事件。
当然,上面是按数学的角度讨论,且我概率才停留在学完第一章的基础水平,难免也有不少错误的地方。如果认同这个基于数学语言的讨论方法,可以进行讨论。否则写一大堆文字,再说另外的问题就是浪费时间。比如你甚至可以不在柯式概率公理体系下,自创一套概率体系,也能推翻一切,但那些在这些日常问题中,可能意义就不大了。
2022-09-05 16:38修改 来自北京
发表回复