课时跟踪检测(一) 回归分析的基本思想及其初步应用
一、选择题
1.(重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:选A 依题意知,相应的回归直线的斜率应为正,排除C、D.且直线必过点(3,3.5),代入A、B得A正确.
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
建立的回归模型拟合效果最好的同学是( )
A.甲 B.乙
C.丙 D.丁
解析:选A 相关指数R2越大,表示回归模型拟合效果越好.
3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71.则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:选D 回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;
由回归方程系数的意义可知回归直线过样本点的中心(,),B正确;
依据回归方程中的含义可知,x每变化1个单位,相应变化约0.85个单位,C正确;
用回归方程对总体进行估计不能得到肯定结论,故D不正确.
4.甲、乙、丙、丁4位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和(yi-i)2,如下表:
甲
乙
丙
丁
散点图
残差平方和
115
106
124
103
哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高?( )
A.甲 B.乙
C.丙 D.丁
解析:选D 从题中的散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差平方和来看,丁同学的最小,说明拟合精度最高.
5.(福建高考)已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,C.a′ D.解析:选C 由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,b′=2,a′=-2.
而利用线性回归方程的公式与已知表格中的数据,
可求得=
==,
=-=-×=-,
所以a′.
二、填空题
6.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为_________.
解析:根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.
答案:1
7.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下表:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为________________.
解析:设y对x的线性回归方程为=x+,
由表中数据得=176,=176,=,
=176-×176=88,
所以y对x的线性回归方程为=x+88.
答案:=x+88
8.关于x与y有如下数据:
x
2
4
5
6
8
y
30
40
60
50
70
为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲:=6.5x+17.5,乙:=7x+17,则____________(填“甲”或“乙”)模型拟合的效果更好.
解析:设甲模型的相关指数为R,
则R=1-=1-=0.845;
设乙模型的相关指数为R,
则R=1-=0.82.
因为0.845>0.82,即R>R,
所以甲模型拟合效果更好.
答案:甲
三、解答题
9.(新课标全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为=,=-.
解:(1)由所给数据计算得
=×(1+2+3+4+5+6+7)=4,
=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
===0.5,
=-=4.3-0.5×4=2.3,
所求回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
10.在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据如下表:
价格x/元
14
16
18
20
22
需求量y/件
56
50
43
41
37
求出y关于x的线性回归方程,并说明拟合效果的好坏.(参考数据:x=1 660,xiyi=3 992)
解:从作出的散点图(图略)可看出,这些点在一条直线附近,可用线性回归模型来拟合数据.
由数据可得=18,=45.4.
由计算公式得=-2.35,=-=87.7.
故y关于x的线性回归方程为=-2.35x+87.7.
列表:
yi-i
1.2
-0.1
-2.4
0.3
1
yi-
10.6
4.6
-2.4
-4.4
-8.4
所以 (yi-i)2=8.3, (yi-)2=229.2.
相关指数R2=1-≈0.964.
因为0.964很接近于1,所以该模型的拟合效果好.