自考 02197 概率论与数理统计(二) 第二章
第一节 离散型随机变量
一、随机变量的概念
定义:设随机试验的样本空间S={e},X=X(\omega)是定义在样本空间S上的单值实值函数,称X=X(e)为随机变量
不管试验结果是否与数值有关,我们都可以通过引入某个变量,使试验结果与数建立了对应关系
二、离散型随机变量及其分布律
随机变量的分类:离散型,连续型
离散型随机变量的定义:随机变量所取得可能值是有限多个或无限可列个,则该随机变量叫做离散型随机变量。如观察掷一个骰子出现的点数,随机变量X的可能值是:1,2,3,4,5,6
离散型随机变量的分布律:
设离散型随机变量X所有可能取的值及相应的概率为
$$
P(X=x_k)=P_k,k=1,2,...
$$
称此为离散型随机变量X的分布律
说明:由概率的定义,P_k满足如下两个条件:
P_K\geq 0,k-1,2,...
\sum \limits _{k=1}^ \infty P_k=1
表示方法:
列表法
公式法
三、0-1分布与二项分布
随机变量X只可能取0和1两个值,其概率函数为:
$$
P(X=k)=p^k(1-p)^{1-k},k=0,1
$$或
$$
\begin{array}{c|lcr} X & \text0 & \text1 & \\ \hline P_k& 1-P & P \\ \end{array}
$$二项分布
随机变量X的所有可能值为0,1,2,...,n,其概率函数为:
$$
P(X=k)=C_n^kp^k(1-p)^{n-k},k-0,1,2,...,n
$$则称X服从参数为n,p的二项分布,记作
$$
X\backsim B(n,p)
$$当n=1时,P(X=k)=p^k(1-p)^{1-k},k=0,1,X化为0-1分布
四、泊松分布
泊松分布:设随机变量X所有可能取的值为0,1,2...,取各个值的概率为
$$
P(X=k)=\frac {\lambda^ke^{-k}}{k!},k=0,1,2...
$$
其中\lambda >0是常数,则称X服从参数为\lambda的泊松分布,记为X\backsim \pi(\lambda)
第二节 随机变量的分布函数
一、分布函数的概念
定义:设X是随机变量,x是任意实数,函数
$$
F(x)=P(X\leq x)
$$
称为随机变量X的概率分布函数或分布函数。
当X为离散型随机变量时,设X的分布律为
$$
p_k=P(X=k),k=0,1,2,...
$$
由于{X \leq x}= \mathop{\cup}\limits_{x_k \leq x}{\{X_1=x_k\}},由概率性质知,
$$
F(x)=P(X\leq x)= \mathop{\sum}\limits_{x_k \leq x}P{\{X=x_k\}},F(x)=\mathop\sum\limits_{X_k \leq x}{P_k}
$$
其中,求和是对所有满足x_k \leq x时x_k相应的概率P_k求和
二、分布函数的性质
分布函数的性质
0\leq F(x) \leq 1
F(x)非减,即若x_1 \leq x_2,则F(x_1 \leq x_2)
F(-\infty)=\lim_\limits{x \to-\infty}F(x)=0,F(+\infty)=\lim_\limits{x \to +\infty}F(X)=1
F(x)右连续,即\lim \limits_{x \to x_0^+}F(x)=F(x_0)
第三节 连续性随机变量及其概率密度
一、连续型随机变量及其概率密度
定义:设随机变量X的分布函数为F(X),如果存在实数轴上的一个非负函数f(x),使得对任意实数x,有
$$
F(X)=\int_{-\infty}^xf(t)dt
$$
则称X为连续随机变量,f(x)为X的概率密度函数,简称密度函数,或密度
显然F'(X)=f(x)
密度函数的性质
f(x) \geq 0
\int_{-\infty}^{\infty}f(x)dx=1
注:连续型随机变量在单点处的概率为零:P\{X=c\}=0
证明:0 \leq P{\{X=c}\} \leq P\{{c-\Delta <X\leq c}\}=\lim\limits_{\Delta x \to 0+} \int_{c- \Delta{x}} ^{x}f(x)dx=0
\therefore P(X=c)=0
P{a<X<b}=P{a<X\leq b} = \int_a^bf(x)dx
二、均匀分布与指数分布
均匀分布:若X的概率密度为
$$
f(x)=\begin{cases} \frac 1 {b-a}, & \text a \leq x \leq b \\ 0, & \text 其它 \end{cases}
$$则称X服从区间[a,b]上的均匀分布,记作X~U(a,b)
它的实际背景是:X取值在区间[a,b]上,并且取值在[a,b]中任意小区间内的概率与这个小区间的长度成正比
则X具有[a,b]上的均匀分布
分布函数
$$
f(x)=\begin{cases} 0,& \text x <a \\ \frac {x-a}{b-a}, & \text a \leq x \leq b \\ 1,&\text x\geq b \end{cases}
$$均匀分布常见于下列情形:
如在数值计算中,由于四舍五入,小数点后某一位小数引入的误差
公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等
指数分布
若随机变量X具有概率密度
$$
f(x)=\begin{cases} \lambda e^{-\lambda x},& \text x > 0 \\ 0, & \text 其它 \\ \end{cases}
$$其中\lambda > 0为常数,则称X服从参数为\lambda的指数分布
记作:X \backsim E(\lambda)
其分布函数为:F(x)=P\{X \leq x\}=\begin{cases} 1-e^{-\lambda x},& \text x > 0 \\ 0, & \text 其它 \\ \end{cases}
指数分布常用于可靠性统计研究中,如元件的寿命
三、正态分布
正态分布:设随机变量X具有一下概率密度
$$
f(x)=\frac 1{\sqrt{2\pi}\sigma}e^{- \frac{(x-\mu)^2}{2 \sigma^2}},-\infty<x<+\infty,\sigma>0
$$
分布函数F(x)=\frac{1}{\sqrt{2 \pi}\sigma}\int_{-\infty}^{x}e^{- \frac {(t- \mu)^2}{2\sigma^2}}dt,-\infty<x<\infty
则称X服从一\mu,\sigma^2为参数的正态分布。记作X \backsim N(\mu,\sigma^2)
\mu,\sigma=1的正态分布称为标准正态分布。记为X\backsim N(0,1)
其密度函数和分布函数常用\varphi(x)和\Phi(x)表示:
$$
\varphi(x)=\frac{1}{\sqrt{2 \pi}}\int_{-\infty}^{x}e^{-\frac{x^2}{2}},-\infty<x<\infty \\
\Phi (x)=\frac {1}{\sqrt{2\pi}} \int_{-\infty}^xe^{-\frac{t^2}{2}}dt,- \infty<x<\infty
$$
\Phi(x)的性质:
\Phi(0)=\frac{1}{2}
\forall x\in R, \Phi(-x)=1- \Phi(x)
若X\backsim N(\mu,\sigma^2),则Z=\frac {X-\mu}{\sigma} \backsim N(0,1).
X\backsim N(\mu,\sigma^2)
\Rightarrow F_x(x)=P\{X \leq x\}=P{\{\frac {X- \mu}{\sigma}} \leq \frac{x- \mu}{\sigma}\}
=\Phi(\frac{x-\mu}{\sigma})
第四节 随机变量函数的概率分布
一、离散型随机变量函数的概率分布
一般,若离散型随机变量X的概率分布为:
$$
\begin{array}{c|lcr}
X & \text x_1 & \text x_2 & \text ... & \text x_k & \text ...\\
\hline
P_k & P_1 & P_2 & ... & P_k & ...
\end{array}
$$
则Y=g(x)的概率分布为:
$$
\begin{array}{c|lcr}
Y=g(X) & \text g(x_1) & \text g(x_2) & \text ... & \text g(x_k) & \text ...\\
\hline
P_k & P_1 & P_2 & ... & P_k & ...
\end{array}
$$
如果g(X_k)中有一些是相同的,把它们作适当并项即可
二、连续型随机变量函数的概率分布
问题:已知X的概率密度f_x(x),求随机变量函数Y=g(X)的概率密度f_Y(y)
一般方法
求Y 的分布函数F_Y(y)
$$
F_Y(y) \underrightarrow{根据分布函数的定义} P(Y \leq y)=P(g(X) \leq y)\\ =P(X \in \{x \mid g(x)\leq y \})
$$对F_Y(y)求导,得到f_Y(y):f_Y(y)=F_Y^y(y)
定理:设随机变量X具有概率密度f_x(x),- \infty < x < \infty,又设函数g(x)处处可导,且有g^\prime(x) > 0(或恒有g^\prime (x)<0
则Y=g(X)是一个连续型随机变量Y,其概率密度为
$$
f_y(y)= \begin{cases}
f_x[h(y)]|[h\prime(y)|, & \text\ \alpha < \beta \\
0, & \text 其它 \\
\end{cases}
$$
其中h(y)是g(x)的反函数
即x=g\prime (y)=h(y)