随机变数

随机变数图片来自华人百科

给定样本空间(S , \mathbb{F})，如果其上的实值函数 X:S \to \mathbb{R}是\mathbb{F} (实值)可测函数^[1] ，则称X为（实值）随机变量。初等概率论中通常不涉及到可测性的概念，而直接把任何X:S \to \mathbb{R}的函数称为随机变量。

如果X指定给概率空间S中每一个事件e有一个实数X(e)，同时针对每一个实数r都有一个事件集合A_r与其相对应，其中A_r= { e : X(e) ≤ r}，那么X被称作随机变量。随机变量一般用大写拉丁字母或小写希腊字母（比如X, Y, Z, \xi, \eta）来表示，从上面的定义注意到，随机变量实质上是函数。称其为变量是指可作为因变量。

例如，随机掷两个骰子，整个事件空间可以由36个元素组成：

S = \lbrace ( i, j ) | i=1, \ldots, 6,; j=1, \ldots,6 \rbrace

这里可以构成多个随机变量，比如随机变量X（获得的两个骰子的点数和）或者随机变量Y（获得的两个骰子的点数差），随机变量X可以有11个整数值，而随机变量Y只有6个。

X ( i, j ) := i+j , x=2,3,\ldots,12

Y ( i, j ) := \mid i-j \mid , y=0,1,2,3,4,5.

又比如，在一次扔硬币事件中，如果把获得的背面的次数作为随机变量X，则X可以取两个值，分别是0和1。

如果随机变量X的取值是有限的或者是可数无穷尽的值

X = \lbrace x_1, x_2, x_3, \ldots, \rbrace,

则称X为离散随机变量。如果X由全部实数或者由一部分区间组成，

X = \lbrace x | a\le x \le b \rbrace, - \infty < a < b < \infty

则称X为连续随机变量。

特性

不确定性

随机变量在不同的条件下由于偶然因素影响，其可能取各种随机变量不同的值，具有不确定性和随机性，但这些取值落在某个范围的概率是一定的，此种变量称为随机变量。随机变量可以是离散型的，也可以是连续型的。如分析测试中的测定值就是一个以概率取值的随机变量，被测定量的取值可能在某一范围内随机变化，具体取什么值在测定之前是无法确定的，但测定的结果是确定的，多次重复测定所得到的测定值具有统计规律性。随机变量与模糊变量的不确定性的本质差别在于，后者的测定结果仍具有不确定性，即模糊性。

基本类型

简单地说，随机变量是指随机事件的数量表现。某地若干名男性健康成人中，每人血红蛋白量的测定值；等等。另有一些现象并不直接表现为数量，例如人口的男女性别、试验结果的阳性或阴性等，但我们可以规定男性为1，女性为0，则非数量标志也可以用数量来表示。这些例子中所提到的量，尽管它们的具体内容是各式各样的，但从数学观点来看，它们表现了同一种情况，这就是每个变量都可以随机地取得不同的数值，而在进行试验或测量之前，我们要预言这个变量将取得某个确定的数值是不可能的。按照随机变量可能取得的值，可以把它们分为两种基本类型：

离散型随机变量

即在一定区间内变量取值为有限个，或数值可以一一列举出来。例如某地区某年人口的出生数、死亡数，某药治疗某病病人的有效数、无效数等

连续型随机变量

即在一定区间内变量取值有无限个，或数值无法一一列举出来。例如某地区男性健康成人的身长值、体重值，一批传染性肝炎患者的血清转氨酶测定值等。

详细分析

表示方法

随机试验结果的量的表示。例如掷一颗骰子出现的点数，电话交换台在一定时间内收到的呼叫次数，随机抽查的一个人的身高，悬浮在液体中的微粒沿某一方向的位移，等等，都是随机变量的实例。一个随机试验的可能结果（称为基本事件）的全体组成一个基本空间Ω(见概率)。随机变量x是定义于Ω上的函数，即对每一基本事件ω∈Ω，有一数值x(ω)与之对应。以掷一颗骰子的随机试验为例，它的所有可能结果见，共6个，分别记作ω1,ω2,ω3,ω4,ω5,ω6,这时，Ω={ω1,ω2,ω3,ω4,ω5,ω6},而出现的点数这个随机变量x，就是Ω上的函数x(ωk)=k，k=1,2,…，6。又如设Ω={ω1,ω2,…，ωn}是要进行抽查的n个人的全体，那么随意抽查其中一人的身高和体重，就构成两个随机变量x和Y,它们分别是Ω上的函数：x(ωk)=“ωk的身高”，Y(ωk)=“ωk的体重”，k=1,2,…，n。一般说来，一个随机变量所取的值可以是离散的（如掷一颗骰子的点数只取1到6的整数，电话台收到的呼叫次数只取非负整数），也可以充满一个数值区间，或整个实数轴（如液体中悬浮的微粒沿某一方向的位移）。

研究方法

在研究随机变量的性质时，确定和计算它取某个数值或落入某个数值区间内的概率是特别重要的。因此，随机变量取某个数值或落入某个数值区间这样的基本事件的集合，应当属于所考虑的事件域。根据这样的直观想法，利用概率论公理化的语言，取实数值的随机变量的数学定义可确切地表述如下：概率空间(Ω,F,p)上的随机变量x是定义于Ω上的实值可测函数，即对任意ω∈Ω，x(ω)为实数，且对任意实数x，使x(ω)≤x的一切ω组成的Ω的子集{ω:x(ω)≤x}是事件，也即是F中的元素。事件{ω:x(ω)≤x}常简记作{x≤x}，并称函数F(x)=p(x≤x)，-∞<x<∞ ，为x的分布函数。设x,Y是概率空间(Ω,F,p)上的两个随机变量，如果除去一个零概率事件外，x(ω)与Y(ω)相同，则称x=Y以概率1成立，也记作p(X=Y)=1或X=Y,α.s.（α.s.意即几乎必然）。

有些随机现象需要同时用多个随机变量来描述。例如对地面目标射击，弹着点的位置需要两个坐标才能确定，因此研究它要同时考虑两个随机变量，一般称同一概率空间(Ω,F,p)上的n个随机变量构成的n维向量X=(x1,x2,…，xn)为n维随机向量。随机变量可以看作一维随机向量。称n元x1,x2,…，xn的函数为X的(联合)分布函数。又如果(x1,x2)为二维随机向量，则称x1+ix2(i2=-1)为复随机变量。随机变量的独立性　独立性是概率论所独有的一个重要概念。设x1,x2,…，xn是n个随机变量，如果对任何n个实数x1,x2,…，xn都有即它们的联合分布函数F(x1,x2,…，xn)等于它们各自的分布函数F1(x1),F2(x2),…，Fn(xn)的乘积。则称x1，x2,…，xn是独立的。这一定义可以直接推广到每一xk(k=1,2,…，n)是随机向量的情形。独立性的直观意义是：x1,x2,…，xn中的任何一个取值的概率规律，并不随其中的其他随机变量取什么值而改变。在实际问题中通常用它来表征多个独立操作的随机试验结果或多种有独立来源的随机因素的概率特性，因此它对于概率统计的应用是十分重要的。

从随机变量(或向量)x1，x2,…，xn的独立性还可以推出：设Bk是xk取值的空间中的任意波莱尔集，k=1,2,…，n。设x1,x2,…，xn是独立的，则它们中的任意个都是独立的。但逆之即使其中任何n-1个是独立的，也不保证x1,x2,…，xn是独立的。又如果ƒj(x),i=1,2,…，n,是n个连续函数或初等函数(或更一般的波莱尔可测函数)，则从x1,x2,…，xn的独立性可推出ƒ1(x1)，ƒ2(x2),…，ƒn(xn)也独立。如果随机变量(随机向量)序列x1,x2,…，xn,…中任何有限个都独立，则称之为独立随机变量（随机向量）序列。关于随机变量的矩、特征函数、母函数及半不变量，分别见数学期望、方差、矩及概率分布。

随机变量的函数

一个新的随机变量能被博雷尔 (Borel) 可测函数定义 g\colon \mathbb{R} \rightarrow \mathbb{R} 来产生一个随机变量X. Y的累积分布函数是：

F_Y(y) = \operatorname{P}(g(X) \le y).

如果博雷尔函数可逆：

F_Y(y) = \operatorname{P}(g(X) \le y) =

begin{cases} \operatorname{P}(X \le g^{-1}(y)) = F_X(g^{-1}(y)), & \text{if } g^{-1} \text{ increasing} ,\\ \\ \operatorname{P}(X \ge g^{-1}(y)) = 1 - F_X(g^{-1}(y)), & \text{if } g^{-1} \text{ decreasing} . \end{cases} 得到它的概率密度函数：

f_Y(y) = f_X(g^{-1}(y)) \left| \frac{d g^{-1}(y)}{d y} \right|.

例子

定义X为实数，在连续性随机变量里，让 Y = X²

F_Y(y) = operatorname{P}(X^2 \le y).

如果y < 0，那么 P(X² ≤ y) = 0

F_Y(y) = 0\qquad\hbox{if}\quad y < 0.

如果y ≥ 0

operatorname{P}(X^2 \le y) = \operatorname{P}(|X| \le \sqrt{y})

可以得到：

F_Y(y) = F_X(\sqrt{y}) - F_X(-\sqrt{y})\qquad\hbox{if}\quad y \ge 0.

参考文献

↑ 可测函数，知乎

[1] 可测函数，知乎

[1]

求真百科