2.1 随机变量
1、概念
对于随机试验:
E
甲,乙两人同时向某目标射击一次
中靶情况
E: ,X表示射击中靶的次数,对应的取值为;0,1,2。
定义:随机变量是定义在样本空间S={ω}上的一个单值实函数,记作X=X(ω),简记为X。
2、分类
1、离散型随机变量
2、非离散型随机变量
2.2 离散型随机变量
一.离散型随机变量的分布
设离散型随机变量可能取的值为:
取这些值的概率为
P(X=i)= pi ,i=1,2,... (2.1)
称(2.1)式为离散型随机变量X的分布律。(2.1)式也可以用表格的形式表示如下:
X
…
…
P
…
…
上述表格称为离散型随机变量X的分布列,分布列也可以表示成下列矩阵的形式:
离散型随机变量的分布律,分布列(以及下一节介绍的分布函数)统称为离散型随机变量的概率分布,简称为离散型随机变量的分布。
根据概率的性质,可知离散型随机变量的分布律具有下列性质
(1)pi0,i=1,2,...
(2)
常见的几种分布
1、单点分布
例: 若随机变量X只取一个常数值C,即P(X=C)=1,则称X服从单点分布。(也叫退化分布。)
2、0-1分布
例: 若随机变量X只能取两个数值0或1,其分布为
X
0
1
P
q
p
0
则称X 服从参数为p 的两点分布或参数为p的0-1分布。
3、几何分布
例: 一射手每次打靶射击一发子弹,打中的概率为p(0
X
1
2
3
…
k
…
P
p
qp
q2p
…
qk-1p
…
或记为
()=, k=1,2, ...
则称X服从参数为p的几何分布。
4、超几何分布
例: 设一批同类型的产品共有N件,其中次品有M件。今从中任取n(假定nN-M)件,则这n件中所含的次品数X是一个离散型随机变量,其分布为
,m=0,1…,k,k=min(M,n)
则称X服从超几何分布。
(2) 二项分布
在n重伯努利试验中,事件A发生的次数X是一个离散型随机变量,其分布为
P( X= k )=,k=0,1,2,¼,n,称X服从参数为n,p的二项分布。记为 。
例2:P39.
例3:P40.
在电脑上,应用相应的数学或统计分析软件,这些概率是很容易计算出来的,所以,还有必要用逼近的方法吗?
泊松分布
1.定义 若离散型随机变量X的分布为,k=0,1,2,¼ 其中常数l>0,则称X服从参数为l的泊松分布,记为。
2.泊松Poisson定理P41, 设有一列二项分布X~B(), n=1, 2, ...,如果 , 为与n无关的正常数,则对任意固定的非负整数k,均有
证略。
例5:P43.
例6:P44,自学。
2.3 随机变量的分布函数
一、概念
定义2.1 设X是一随机变量(不论是离散型还是非离散型),对任意的实数,令
(2.11)
则称F()为X的分布函数。
例1:(书上例2.8) 设X服从参数为p的(0-1)分布,即:,= 0,1,其中0
例: 设R.V. X的分布函数为
求X的概率分布。
二、性质
性质1 若1<2,则F(1)£F(2).即F()是的单调不减函数。
性质2 对任意的实数,均有
0£ F()£1 (2.15)
且
(2.16)
(2.17)
性质3 对任意的实数0,有
(2.18)
即F()在轴上处处右连续。
证明见P-44.
性质4 若F()在X=0处连续,则P(X=0)=0
性质5 P(a
确定A ,且求P(-1<£2)
2.4 连续型随机变量
1、定义2.2
设随机变量X的分布函数为F(),如果存在一个非负可积函数f(),使对任意的实数,均有
F()= (2.20)
则称X是连续型随机变量,称f()是X的概率密度或密度函数,简称密度。
二、图形
例如:正态分布
密度函数图形:
data normal;
do i=-3 to 3 by 0.01;
z0=exp(-i**2/2)/sqrt(2*(3.1415926));
output;
end;
run;
proc gplot data=normal;
plot z0*i=1 ;
symbol1 v=none i=join r=1 c=black;
run;
分布函数图形:
data normal;
do x=-3 to 5 by 0.01;
y=PROBNORM(x);
output;
end;
run;
proc gplot data=normal;
plot y*x=1 ;
symbol1 v=none i=join r=1 c=black;
run;
三、性质
性质1 f()0 (2.21)
性质2 (2.22)
性质3 P(a
性质4 在f()的连续点处,有
= (2.24)
性质5 在f()的连续点处,当>0,且很小时,有
P(
1.由5可以看出f()值的大(小)反映R.V.X在邻域概率的大(小)。
2.连续型随机变量X取任一点0的概率为零。即:P(X=0)=0。
3.连续型随机变量X的密度函数为f(),则它取值于区间(a,b)、(a,b]、[a,b)、[a,b]上的概率都相等,即
同理,。
4.连续型R.V.X的F()是连续函数。但f()不一定是连续的。
例1:(P51)设计R.V.X具有概率密度
确定常数K,并求P{X>0.1}
指数分布:
例:(第一版)设R.V.
(1)确定常数A;(2)写出X的分布函数F(); (3)P。
例:(第一版) 已知随机变量
(1)确定A和B;(2)求;(3)求
二、均匀分布
例:设R.V.,称X在[,b]上服从均匀分布。(1)确定k。(2)求P(a
则称X在[]上服从均匀分布,记为X~U[a,b],相应的分布函数为
一般地,设是轴上一些不相交的区间之和,若的概率密度为
则称X在D上服从均匀分布。
如果,则对于满足的任意的,有 = (2.32)
三、指数分布
若随机变量X的概率密度为
(2.33)
其中常数,则称X服从参数为l的指数分布,相应的分布函数为
(2.34)
例:(第一版书上例2.12) 经过长期的观测,对某些电子元件的寿命可作如下假定:在已使用了th的条件下,在以后的Dth内损坏的概率为,其中l是不依赖于t的常数;电子元件寿命为零的概率是零,求电子元件在内损坏的概率。略
四、正态分布
1、定义: 若随机变量X的概率密度为
, (2.35)
其中都为常数且,则称X服从参数为的正态分布,记为,有时也简称X为正态随机变量。X的分布函数为
(2.36)
2、验证
3、作出的图形
,得驻点,
得,
作图SAS程序:
data normal;
do i=-3 to 3 by 0.01;
z0=exp(-i**2/2)/sqrt(2*(3.1415926));
output;
end;
run;
proc gplot data=normal;
plot z0*i=1 ;
symbol1 v=none i=join r=1 c=black;
run;
注意:一定要和由正态随机数区别开来。如下面产生的是正态随机数。
data normal;
retain _seed_ 0;
do _i_ = 1 to 1000;
z = 0 + 1 * rannor(_seed_);
output;
end;
drop _seed_ ;
run;
proc gplot data=normal;
plot z*_i_=1 ;
symbol1 v=none i=join r=1 c=black;
run;
4、性质:
(1)f(x)的图形是关于直线x=m对称的曲线
(2)为最大值,当x远离m时,f(x)®0
(3)当m固定而s变化时对图形的影响,s小
大,分布曲线在形成陡峭的高峰。
s大小,分布曲线在变成缓峰。
m=2, s=0.5, 1, 2
data normal;
do i=-2 to 6 by 0.01;
z0=exp(-(i-2)**2/2)/sqrt(2*(3.1415926));
z1=exp(-(i-2)**2/(2*0.25))/(0.5*sqrt(2*(3.1415926)));
z2=exp(-(i-2)**2/(2*4))/(2*sqrt(2*(3.1415926)));
output;
end;
proc gplot data=normal;
plot z0*i=1 z1*i=1 z2*i=1 /overlay ;
symbol1 v=none i=join r=1 c=black;
run;
m=2, s=0.5, 1, 2, 5, 10图形:
data normal;
do i=-5 to 9 by 0.01;
z0=exp(-(i-2)**2/2)/sqrt(2*(3.1415926));
z1=exp(-(i-2)**2/(2*0.25))/(0.5*sqrt(2*(3.1415926)));
z2=exp(-(i-2)**2/(2*4))/(2*sqrt(2*(3.1415926)));
z3=exp(-(i-2)**2/(2*25))/(5*sqrt(2*(3.1415926)));
z4=exp(-(i-2)**2/(2*100))/(10*sqrt(2*(3.1415926)));
output;
end;
run;
proc gplot data=normal;
plot z0*i=1 z1*i=1 z2*i=1 z3*i=1 z4*i=1 /overlay ;
symbol1 v=none i=join r=1 c=black;
run;
(4)当s固定而当m变化时对图形的影响是分布曲线形状不变,仅曲线左、右平移。
如图:s=1, m=0, 2
data normal;
do i=-3 to 5 by 0.01;
z0=exp(-i**2/2)/sqrt(2*(3.1415926));
z1=exp(-(i-2)**2/2)/sqrt(2*(3.1415926));
output;
end;
run;
proc gplot data=normal;
plot z0*i=1 z1*i=1/overlay ;
symbol1 v=none i=join r=1 c=black;
run;
分布函数图:
data normal;
do x=-5 to 10 by 0.01;
y=PROBNORM(x);
output;
end;
run;
proc gplot data=normal;
plot y*x=1 ;
symbol1 v=none i=join r=1 c=black;
run;
3、标准正态分布与有关概率的计算
若,则称X服从标准正态分布,其概率密度、分布函数分别记为
(x)= (2.37)
Φ(x)= (2.38)
注意:Φ(0)=0.5
Φ(-x)=1-Φ(x)
一般,若,我们只要通过一个线性变换就能将它化成标准正态分布。
引理(P55):若,则
证:
作变换,…….
学会查附表2:标准正态分布表。注意表中公式的正确形式为:
注:如果用SAS算出附表2,需要时间不到1秒钟。
data normal;
do z=0 to 4 by 0.01;
Prob=PROBNORM(z);
output;
end;
proc print noobs;
run;
这样还可以算出其它任意条件的概率。如利用
即
(2.43)
对任意的实数1,2 (1<2),利用(2.43)式可得
Φ() (2.44)
1-Φ() (2.45)
Φ()-Φ() (2.46)
比如:, m=1.5 s=2时:
全部概率值:
data normal;
do z=0 to 4 by 0.01;
Prob=PROBNORM((z-1.5)/2);
output;
end;
proc print noobs;
run;
P(X>0)=
data ;
Prob=1- PROBNORM((0-1.5)/2); Put prob=;
Run;
Prob=0.773372647
P(-1
Prob= PROBNORM((2-1.5)/2)- PROBNORM((-1-1.5)/2); Put prob=;
Run;
Prob=0.493056552
例1: X服从N(1,4),求P(x£1.6) , P(0
解:请大家通过变换后查表得出结果。并与下面的结果进行对比。
data ;
prob=probnorm((1.6-1)/2); put prob=;
prob=probnorm((1.6-1)/2)- probnorm((0-1)/2); put prob=;
prob=1-probnorm((4-1)/2)+probnorm((-4-1)/2); put prob=;
run;
P(x£1.6)=0.6179114222
P(0
例3 P56 将一温度调节器放置在储存着某种液体的容器中。调节器定在doc,液体的温度为X(以co记)服从N(d,0.52)。(1)若d=90,求P(X<89)=?;(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少
解:
(1)
data ;
prob=probnorm((89-90)/0.5); put prob=;
run;
P(X<89)=0.0227501319
(2)要求0.99P{X>80}
即 P{X<80}0.01
P{(X-d)/0.5<(80-d)/0.5}0.01
(80-d)/0.5-2.326347874
data;
Z=probit(.010); put Z=;
run;
Z=-2.326347874
定义:设X~N(0, 1),若满足条件
,
则称点为标准正态分布的上分位点。
书上57页图
例:
下分位数:
data;
Z1=probit(.001); put Z1=;
Z2=probit(.0025); put Z2=;
Z3=probit(.005); put Z3=;
Z4=probit(.010); put Z4=;
run;
Z1=-3.090232306 ()
Z2=-2.807033768 ()
Z3=-2.575829304 ()
Z4=-2.326347874 ()
上分位数:
data;
Z1=probit(1-.001); put Z1=;
Z2=probit(1-.0025); put Z2=;
Z3=probit(1-.005); put Z3=;
Z4=probit(1-.010); put Z4=;
run;
Z1=3.0902323062
Z2=2.8070337683
Z3=2.5758293035
Z4=2.326347874
本人不同意分为上下分位数,分位数就是分位数,定义为:
若满足条件
,
则称点为随机变量的分位数。
单边的, 双边的,
注意和以均值为中心,1,2,3倍标准差宽度区间的概率值的区别。
SAS的两种计算公式:
data;
p1=PROBNORM(1)-PROBNORM(-1); put p1=;
p2= PROBNORM(2)-PROBNORM(-2); put p2=;
p3= PROBNORM(3)-PROBNORM(-3); put p3=;
run;
p1=0.6826894921
p2=0.9544997361
p3=0.9973002039
data;
p1=2*PROBNORM(1)-1; put p1=;
p2=2*PROBNORM(2)-1; put p2=;
p3=2*PROBNORM(3)-1; put p3=;
run;
p1=0.6826894921
p2=0.9544997361
p3=0.9973002039
也可以验证数据,即以为中心,需要几倍的标准差距离所构成的区间,其区间内的概率为上述所示。
Data;
q1=abs(probit((1-0.6826894921)/2));put q1=;
q2=abs(probit((1-0.9544997361)/2));put q2=;
q3=abs(probit((1-0.9973002039)/2));put q3=;
run;
q1=0.9999999999
q2=2
q3=2.9999999959
data;
q1=probit(1-(1-0.6826894921)/2);put q1=;
q2=probit(1-(1-0.9544997361)/2);put q2=;
q3=probit(1-(1-0.9973002039)/2);put q3=;
run;
q1=0.9999999999
q2=2
q3=2.9999999959
注意:为中心,概率为90%,95%,98%,99%的区间,需要几倍的标准差距离。
Data;
q1=abs(probit((1-0.9)/2));put q1=;
q2=abs(probit((1-0.95)/2));put q2=;
q3=abs(probit((1-0.98)/2));put q3=;
q3=abs(probit((1-0.99)/2));put q3=;
run;
q1=1.644853627
q2=1.9599639845
q3=2.326347874
q3=2.5758293035
比如,
=0.95
等的结论也是常用的。几乎都成常识了。
以下例1---4为第一版内容。
例1: X服从N(1,4),求P(x£1.6) , P(1
例2: 将一温度调节器放置在储存着某种液体的容器中。调节器定在doc,液体的温度为X(以co记)服从N(d,0.52)。(1)若d=90,求P(X<89)=?;(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少
例:(书上例2.14) 某市高校高等数学统考,假定考生成绩X~。现已知80分以上者占总人数的33%,40分以下者占总人数的8%,求考生的及格率(即60分以上者占总人数的百分比)。
例3:(书上例2.15) 一桥长60cm,以桥的中心为原点,沿着桥的方向引入坐标轴如书上图2-10。一架飞机沿着坐标轴俯冲投弹轰炸此桥,假定弹着点的坐标X~N.(1)求投掷一枚炸弹,命中此桥的概率p;(2)问独立重复投掷多少枚炸弹,才能使至少有一弹命中此桥的概率大于0.9。
例4:(书上例2.16) 甲,乙,丙三个工厂生产同一种产品且产量相等。它们的产品每件某种物质的含量(单位:mg)分别为,且, , .(1)今从三个厂的产品中任取一件,求这件产品某种物质的含量大于55mg的概率。(2)今从三个厂的产品中独立地任取两件,求这两件产品某种物质地含量都不大于55mg的概率。
2.5 随机变量函数的分布
1、若X是离散型随机变量
X
…
…
…
…
P
…
…
例1 P58,已知X分布列为
X -1 0 1 2
P 0.2 0.3 0.1 0.4
求Y=(X-1)2的分布列
解:Y的所有可能取的值为0,1,4.
例1 (第一版) 已知X分布列为
X -2 –1 0 1 2
P 1/6 1/4 1/6 1/4 1/6
求Y=(1/2)X2的分布列
解:Y的所有可能取的值为:0,1/2, 2
练习。。
二、X是连续型随机变量
1.当是单调函数
例2,P58页:
例3,P59
定理 若连续型随机变量X只在上取值,它的概率密度为,又是严格单调的可导函数,则是连续型随机变量,其概率密度为
其中是的反函数,是的值域。
例1 (第一版), 第二版,P60例4, 设R.V.X~N(), 求的概率密度(是常数)
法一、用公式 ~
是单调函数,可直接用公式。
的反函数为,
~
,
可知 ~ 。
法二、直接法,见书P-57~58(第一版)。答案同上。
小结:正态分布R.V的线性函数仍是正态R.V。
例5,P61。。。
例2 (第一版) 假设随机变量X服从参数为2的指数分布,证明: 在区间[0,1]上服从均匀分布。
法一、公式法;法二、直接法。
2、当是非单调函数 (第一版)
例1:X服从N(0,1),求Y=X2的概率密度。
例2:已知连续型随机变量X的概率密度为
求的概率密度。
本章习题:
1,3,4,5,18,19,23,25,26,27,29,30.