随机变量

离散随机变量

样本空间 ​​ 有限或无限可数,则其随机变量 称为离散随机变量。

概率质量函数(probability mass function, pmf):

连续随机变量

累积分布函数(Cumulative distribution function, cdf):

事件 ,其中 ,则有 ,所有:

用随机变量定义累积分布函数: ,则上式改写为:

例如,标准正态分布 的 cdf 图像(此 cdf 通常记作: ):

概率密度函数(Probability density function, pdf):

若已知 pdf ,计算连续随机变量的概率(有限区间):

分位数(quantile)

如果累积分布函数 严格单调递增,则它有一个逆函数,称为 cdf 逆,或者百分位函数(ppf),或者分位函数

如果 的累积分布函数,对于 的逆是 ,称为 的第 分位。

  • 是分布的中位数
  • 分别是上四分位和下四分位

例如标准正态分布 ,点 以左表示含 的概率质量。如下图所示

定理

定理 1: 的分布函数,则:

(1) 单调不减右连续;

(2)

(3)

(4) 在点 连续的充分必要条件是

证明

(1)对 ,由 得到:

证明右连续。因为 关于 单调有界,所以当 时有极限,并且该极限等于其子序列的极限,集合 越小,所以用概率的连续性得到:

说明 是右连续函数。

(2)因为 关于 单调有界,所以当 时有极限,并且该极限等于其子序列的极限,又因为 越大,集合 越大,所以用概率的连续性得到:

且有

(4)可由(2)得出。

参考资料

[1]. Kevin P. Murphy. Probabilistic Machine Learning An Introduction[M]:43-44. The MIT Press.

[2]. 概率引论. 何书元. 北京:高等教育出版社. 2012.1,第1版

作者: 老齐
链接: http://math.itdiffer.com/random_variables.html
来源: 老齐教室-机器学习数学基础
本文原创发布于「老齐教室-机器学习数学基础」,转载请注明出处,谢谢合作!

https://gitee.com/qiwsir/images/raw/master/2021-2-15/1613357594979-1.png

results matching ""

    No results matching ""