概率基础
打开本页,如果不能显示公式,请刷新页面。
古典概型常用计算方法
- 从 个不同的元素中有放回地每次抽取一个,依次抽取 个排成一列,可以得到 个不同的排列。当随机抽取时,得到的不同排列是等可能的。
- 从 个不同的元素中无放回第抽取 个元素排成一列时,可以得到 个不同的排列。当随机抽取和排列时,得到的不同排列是等可能的。
- 从 个不同的元素中无放回第抽取 个元素,不论次序地组成一组,可以得到 个不同的组合。当随机抽取时,得到的不同组合是等可能的。
- 将 个不同的元素分成有次序的 组,不考虑每组中元素的次序,第 组有 个元素的不同结果数是 。当随机分组时,得到的把不同结果是等可能的。
概率空间定义
设 是 域,如果 满足条件:
(a)非负性:对于任何事件 , ;
(b)完全性: ;
(c)可列可加性:对于 中互不相容的事件 ,有:
则称 是 上的概率,简称为概率,称 是 发生的概率,称 是概率空间。
概率的性质
性质(1):空集的概率是 0:
证明
由概率的可列可加性和 可得
所以, 。
性质(2):有限可加性:如果 互不相容,则
证明
因为 互不相容, 由概率的可列可加性得到:
性质(3):
证明
因为
故得证。
性质(4)可减性:如果 ,则
证明
由性质(2)和 可得:
移项后可证。
性质(5)单调性:如果 ,则
证明
由性质(4)可知 ,于是
性质(6)次可加性:对于事件 ,有
证明
取 ,则 互不相容,由 得:
当 发生,有 可知,一定有某个 发生,但是 不发生,于是 发生。于是得:
,
由概率的有限可加性得:
加法公式
加法公式 1:对事件 、 有:
证明
因为 和 ,所以:
加法公式 2:对事件 有:
证明
由加法公式 1 可得:
因为 ,所以
代入前面的式子,则:
加法公式 3:(若尔当(Jordan)公式)对于事件 ,有:
加法公式 3 是公式 1 和公式 2 的一般化。
加法公式 4:如果对 和 ,总有 ,则对 有:
推导
在 中取出 个数,有 种取法,所以:
对 和 ,有
则:
事件的独立性
定义
如果 ,则称 、 相互独立,简称独立(independent)。
推广:
称事件 相互独立,如果对任何 有:
称事件 相互独立,如果对任何 ,事件 相互独立,这是也称 是独立事件列。
定理
定理 1: 、 独立当且仅当 、 独立
证明
当 、 独立,由 得:
即 、 独立。
如果 、 独立,则由上述可得 、 独立。
条件概率和乘法公式
条件概率公式
如果 ,则:
乘法公式
设 , ,则:
证明
(1)式可由条件概率公式得到。
(2)式右边每个因子使用条件概率公式得:
全概率公式
对于任何时间 ,由概率的甲方公式得到:
再用乘法公式,得到全概率公式:
推广为一般形式:
如果事件 互不相容, ,则:
证明
因为 ,且 互不相容,所以:
如果事件 互不相容, ,则称 是完备事件组,这是 自然成立。于是上述全概率公式的一般形式对任何事件 成立。
典型问题
1. 赌徒破产模型
问题:甲有本金 a 元,决心再赢 b 元停止赌博。设甲每局赢的概率是 ,每局输赢都是一元钱,甲输光后停止赌博,求甲输光的概率 。
解
用 表示甲第一局赢,用 表示甲有本金 元时最后输光,则 。
已知 发生后,甲的本金增加医院,所以:
已知 放生后,甲的本金减少医院,所以:
由题意, ,并且:
于是有 ,从而得到:
上式两边对 求和后得到:
取 ,得到:
则:
当甲的本金 a 有限,贪心 b 越大,输光的概率越大,如果一直赌下去, ,必定输光。
推广
对上述赌徒模型做进一步研究。假设有 个赌徒加入公平赌博(这个假设很重要),第 个赌徒的赌资为 ,则 是所有赌徒的全部赌资,于是得到第 个赌徒输光的概率是:
若 是有限数,且赌徒充分多,则每个 都接近于 1 。于是,随着时间的推移,大多数赌徒陆续输光,赌资会向少数几个赌徒集中,这就是赌庄逐步形成的过程。如果没有新的赌徒加入,赌庄之间的陆续赌博将使得所有赌资最后集中在一个赌庄手中。
若有无穷多新的赌徒加入,则会有新的赌庄陆续形成。
但最终,逃脱不掉破产的命运。
在非公平赌博模型下,赌徒破产和赌庄聚集赌资都会加快,且赌庄会以一个正概率不破产。
2. 取球问题
在《机器学习数学基础》的第 5 章 5.5.2 节介绍全概率公式的内容时,有这样一个例题:
假设有两个口袋,第一个口袋里面有 个黑球,第二个口袋里面有 个黑球、 个白球。所有的球除了颜色差异之外,其他都一样。随机选一个口袋,并从中取出 个球,问取出 个黑球的概率是多少?
书中对这个例题,使用全概率公式进行了求解,过程如下:
这个试验的样本空间 ,可以根据问题中的“两个口袋”将样本空间划分为 和 。“随机选一个口袋”就是从 和 两个划分(事件)中随机选一个,可得:
用 表示“取出 个黑球”事件,根据(5.2.5)式可得:
有读者认为上式中的 不应该是 ,应该是 。对此,解答如下,请参考。
为了简化问题,把 单独拿出来,即转化为一个简单问题:有一个口袋里有三个球,其中两个黑色的,一个白色的,问从该口袋中取出两个黑色球的个概率是多少。
如果从操作的层面看,这个问题可以通过两个操作方式,都达到最终得到两个黑色球的结果:
- 方式 1:先取一个黑球,以不放回的方式抽取,再去第二个黑球,最终得到了两个黑球。
- 方式 2:同时从口袋中取出两个黑球。
下面根据上述两种方式,分别计算最终得到两个黑球的概率。
方式 1:一个一个地连续抽取
解法 1:
用 表示“取出第 1 个黑球”事件,则: 。
用 表示“取出第 2 个黑球”事件,由于不放回抽取, 是在 发生的条件下发生的,当 发生后,口袋里面还有一个黑球和一个白球。所以: 。
根据条件概率公式,连续取两个黑球的概率 应为:
故,按照不放回抽样方式,连续从 中抽取到两个黑球的概率是
解法 2:
假设袋子中的球都有编号,如 中显示的那样,可以根据排列,计算出每两个球的排列可能,即样本空间的样本点数量,或基本事件总数:
连续抽取两个黑球,可能是 ,也可能是 ,即事件“连续抽取两个黑球”的样本点数量为: 。
所以,连续抽取两个黑球的概率是:
方式 2:从口袋中同时取出
不需要对口袋 中的球进行排列,只要组合即可。
样本空间的样本点数量为:
一次性抽取两个黑球的事件数量,显然为 1 ,或者计算:
所以,从口袋 中一次性抽取到两个黑球的概率为
参考文献
[1]. 概率引论. 何书元. 北京:高等教育出版社. 2012.1,第1版
作者: 老齐
链接: http://math.itdiffer.com/probability_space.html
来源: 机器学习
本文原创发布于「机器学习」,转载请注明出处,谢谢合作!