高中数学基础:随机变量及其分布
基本概念
若随机变量$X$服从一个数学期望为$μ$、方差为$σ^2$的正态分布,记为$N(μ,σ^2)$。其概率密度函数为正态分布的期望值$μ$决定了其位置,其标准差$σ$决定了分布的幅度。当$μ = 0, σ = 1$时的正态分布是标准正态分布。
离散型随机变量
(1)随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。随机变量常用字母$X,Y,\xi,\eta$ 等表示。
(2)离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。
(3)连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量。
(4)离散型随机变量与连续型随机变量的区别与联系:离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续型随机变量的结果不可以一一列出。
(5)若$X$是随机变量,$Y=aX+b$($a,b$是常数),则$Y$也是随机变量,并且不改变其属性(离散型、连续型)。
离散型随机变量的分布列
概率分布(分布列)
设离散型随机变量$X$可能取的不同值为$x_1,x_2,···,x_i,···,x_n$,$X$的每一个值$x_i \, (i=1,2,···,n)$的概率$P(X=x_i)=p_i$,则称表
$X$ | $x_1$ | $x_2$ | $···$ | $x_i$ | $···$ | $x_n$ |
---|---|---|---|---|---|---|
$P$ | $p_1$ | $p_2$ | $···$ | $p_i$ | $···$ | $p_n$ |
为随机变量$X$的概率分布,简称$X$的分布列。
性质:
① $pi≥0,i=1,2,...n$
② $\sum{i=1}^np_i=1$
两点分布
如果随机变量$X$的分布列为
$X$ | 0 | 1 |
---|---|---|
$P$ | $1-p$ | $p$ |
则称$X$服从两点分布,并称$p=P(X=1)$为成功分布。
二项分布
如果在一次试验中某事件发生的概率是$p$,那么在$n$次独立重复试验中这个事件恰好发生$k$次的概率是
$P(X=k) = C_n^kp^k(1-p)^{n-k}$,其中$k=0,1,2,...,n, \, q=1-p$,于是得到随机变量$X$的概率分布如下:
$X$ | 0 | 1 | $···$ | $k$ | $···$ | $n$ |
---|---|---|---|---|---|---|
$P$ | $C_n^0p^0q^n$ | $C_n^1p^1q^{n-1}$ | $···$ | $C_n^kp^kq^{n-k}$ | $···$ | $C_n^np^nq^0$ |
我们称这样的随机变量$X$服从二项分布,记作$X~B(n,p)$,并称$p$为成功概率。
判断一个随机变量是否服从二项分布,关键有三点:
① 独立性:即一次试验中事件发生与否二者必居其一;
② 重复性:即试验是独立重复地进行了$n$次
③ 等概率性:在每次试验中事件发生的概率均相等。
注:二项分布的模型是有放回抽样
离散型随机变量的均值与方差
(1)离散型随机变量的均值
一般地,若离散型随机变量$X$的分布列为
$X$ | $x_1$ | $x_2$ | $···$ | $x_i$ | $···$ | $x_n$ |
---|---|---|---|---|---|---|
$P$ | $p_1$ | $p_2$ | $···$ | $p_i$ | $···$ | $p_n$ |
则称:
$E(X)=x_1p_1+x_2p_2+···+x_ip_i+···+x_np_n$
为离散型随机变量$X$的均值或期望,反映了离散型随机变量取值的平均水平。
性质:
① $E(aX+b)=aE(X)+b$
② 若$X$服从两点分布,则$E(X)=p$
③ 若$X~B(n,p)$,则$E(X)=np$
(2)离散型随机变量的方差
一般地,若离散型随机变量$X$的分布列为
$X$ | $x_1$ | $x_2$ | $···$ | $x_i$ | $···$ | $x_n$ |
---|---|---|---|---|---|---|
$P$ | $p_1$ | $p_2$ | $···$ | $p_i$ | $···$ | $p_n$ |
则称:
$D(X)=\sum_{i=1}^n(x_i-E(X))^2p_i$
为离散型随机变量$X$的方差,并称其算术平方根$\sqrt{D(X)}$为随机变量$X$的标准差。反映了离散型随机变量取值的稳定与波动,集中与离散的程度。$D(X)$越小,$X$的稳定性越高,波动越小,取值越集中;$D(X)$越大,$X$的稳定性越差,波动越大,取值越分散。
① $D(aX+b)=a^2D(X)$
② 若$X$服从两点分布,则$D(X)=p(1-p)$
③ 若$X~B(n,p)$,则$D(X)=np(1-p)$
正态分布
正态分布概率密度曲线函数表达式为:
$$
f(x)=\frac{1}{\sqrt{2\pi}·\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, \, x \in R
$$
其中$\mu,\sigma$是参数,且$\sigma>0,-∞<\mu<+∞$,记作$N(\mu,\sigma^2)$,曲线如下图:
版权声明:
作者:Joe.Ye
链接:https://www.appblog.cn/index.php/2023/04/02/fundamentals-of-high-school-mathematics-random-variables-and-their-distributions/
来源:APP全栈技术分享
文章版权归作者所有,未经允许请勿转载。
共有 0 条评论