随机变量

打开本页,如果不能显示公式,请刷新页面。

在概率论,一个试验由下列三个概念组成

  1. 样本空间 包含所有可能的实验结果,
  2. 定义于 的所有事件,
  3. 每一个事件的概率。

现实问题中,实验结果常被赋予可度量的性质。例如,考虑投掷一枚硬币 100 次,结果 可用 (正面) 与 (反面) 所组成的长度为 的字串表示。这个实验的样本空间 个字串 (元素)。假设我们关心出现正面的次数,令函数 等于字串 所含的 的数量,例如, 。函数 的值域为 。对于 ,存在 个字串 使得 ,其中 代表从 个元素选取 个元素的组合数。因此, 。在建立概率模型时,以函数 的值域取代样本空间有两个明显的好处:

  • 第一,函数 由我们所考虑的问题决定,据此建立的模型呈现问题情境。
  • 第二,函数 的值域是数组成的集合故而便利计算。我们在试验的样本空间 上制定的函数 引申出概率学的一个核心概念,称为随机变量 (random variable)。

随机变量 是一个函数 。对于实验结果 表示所指定的一个数, 表示 的指定规则。

随机变量一词很容易引起误解,称为「随机函数」比较恰当,原因是 本身并非实验结果,而是 的输入变量是一个实验结果。随机变量的值域设为实数,仅为配合多数的应用,并不具强制性。为了与一般的函数有所区隔,我们不以通用的函数记号 表示随机变量。近代概率论或统计学常以斜体大写字母 表示随机变量,而其实,它是一个向量。

离散随机变量

样本空间 ​​ 有限或无限可数,则其随机变量 称为离散随机变量。

概率质量函数(probability mass function, pmf):

连续随机变量

累积分布函数(Cumulative distribution function, cdf):

事件 ,其中 ,则有 ,所有:

用随机变量定义累积分布函数: ,则上式改写为:

例如,标准正态分布 的 cdf 图像(此 cdf 通常记作: ):

概率密度函数(Probability density function, pdf):

若已知 pdf ,计算连续随机变量的概率(有限区间):

分位数(quantile)

如果累积分布函数 严格单调递增,则它有一个逆函数,称为 cdf 逆,或者百分位函数(ppf),或者分位函数

如果 的累积分布函数,对于 的逆是 ,称为 的第 分位。

  • 是分布的中位数
  • 分别是上四分位和下四分位

例如标准正态分布 ,点 以左表示含 的概率质量。如下图所示

定理

定理 1: 的分布函数,则:

(1) 单调不减右连续;

(2)

(3)

(4) 在点 连续的充分必要条件是

证明

(1)对 ,由 得到:

证明右连续。因为 关于 单调有界,所以当 时有极限,并且该极限等于其子序列的极限,集合 越小,所以用概率的连续性得到:

说明 是右连续函数。

(2)因为 关于 单调有界,所以当 时有极限,并且该极限等于其子序列的极限,又因为 越大,集合 越大,所以用概率的连续性得到:

且有

(4)可由(2)得出。

参考资料

[1]. Kevin P. Murphy. Probabilistic Machine Learning An Introduction[M]:43-44. The MIT Press.

[2]. 概率引论. 何书元. 北京:高等教育出版社. 2012.1,第1版

[3]. 概率论的基本概念

作者: 老齐
链接: http://math.itdiffer.com/random_variables.html
来源: 机器学习
本文原创发布于「机器学习」,转载请注明出处,谢谢合作!

http://math.itdiffer.com/images/0.jpg

results matching ""

    No results matching ""