回归分析 知识点题库

下列说法正确的有(  )
①最小二乘法指的是把各个离差加起来作为总离差,并使之达到最小值的方法;
②最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;
③线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;
④因为由任何一观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.

A . 1个 B . 2个 C . 3个 D . 4个
线性回归直线方程必过定点(  )

A . (0,0) B . C . D .
在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是(   )

A . 总偏差平方和 B . 残差平方和 C . 回归平方和 D . 相关指数R2
以下可用来分析身高与体重间关系的是(    )
A . 残差图 B . 回归分析 C . 等高条形图 D . 独立性检验
下列说法中正确的有.

①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法

已知某产品连续4个月的广告费用xi(i=1,2,3,4)千元与销售额yi(i=1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息:

①x1+x2+x3+x4=18,y1+y2+y3+y4=14;

②广告费用x和销售额y之间具有较强的线性相关关系;

③回归直线方程=bx+a中的b=0.8(用最小二乘法求得);

那么,当广告费用为6千元时,可预测销售额约为(  )

A . 3.5万元 B . 4.7万元 C . 4.9万元 D . 6.5万元
在线性回归模型中,以下哪些量的变化表示回归的效果越好(  )

A . 总偏差平方和越小 B . 残差平方和越小 C . 回归平方和越大 D . 相关指数R2越大
对于一组数据的两个函数模型,其残差平方和分别为153.4 和200,若从中选取一个拟合程度较好的函数模型,应选残差平方和为 的那个.

某城市近10年居民的年收入x与支出y之间的关系大致符合=0.9x+0.2(单位:亿元),预计今年该城市居民年收入为20亿元,则年支出估计是 亿元.

已知x,y的取值如下表:

x

0

1

3

4

y

2.2

4.3

4.8

6.7

从散点图分析,y与x线性相关,则回归方程为=bx+a必过点 

下列四个判断:

①某校高三一班和高三二班的人数分别是m,n,某次测试数学平均分分别是a,b,则这两个班的数学平均分为

②10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有c>a>b;

③从总体中抽取的样本(x1 , y1),(x2 , y2),…,(xn , yn),若记=xi=yi则回归直线y=bx+a必过点(,);

④已知ξ服从正态分布N(0,σ2),且p(﹣2≤ξ≤0)=0.3,则p(ξ>2)=0.2;

其中正确的个数有(  )

A . 0个 B . 1个 C . 2个 D . 3个
2015男篮亚锦赛决赛阶段,中国男篮以9连胜的不败战绩赢得第28届亚锦赛冠军,同时拿到亚洲唯一1张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛MVP(最有价值球员),下表是易建联在这9场比赛中投篮的统计数据.

比分

易建联技术统计

投篮命中

罚球命中

全场得分

真实得分率

中国91﹣42新加坡

3/7

6/7

12

59.52%

中国76﹣73韩国

7/13

6/8

20

60.53%

中国84﹣67约旦

12/20

2/5

26

58.56%

中国75﹣62哈萨克期坦

5/7

5/5

15

81.52%

中国90﹣72黎巴嫩

7/11

5/5

19

71.97%

中国85﹣69卡塔尔

4/10

4/4

13

55.27%

中国104﹣58印度

8/12

5/5

21

73.94%

中国70﹣57伊朗

5/10

2/4

13

55.27%

中国78﹣67菲律宾

4/14

3/6

11

33.05%

注:(1)表中a/b表示出手b次命中a次;

(2)TS%(真实得分率)是衡量球员进攻的效率,其计算公式为:

TS%=.全场得分/2x(投篮出手次数+0.44x罚球出手次数)

(Ⅰ)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%超过50%的概率;

(Ⅱ)从上述9场比赛中随机选择两场,求易建联在这两场比赛中TS%至少有一场超过60%的概率;

(Ⅲ)用x来表示易建联某场的得分,用y来表示中国队该场的总分,画出散点图如图所示,请根据散点图判断y与x之间是否具有线性相关关系?结合实际简单说明理由.

已知x,y的取值如下表:从散点图可以看出y与x线性相关,且回归方程为=0.95x+a,则a=(  )

x

0

1

3

4

y

2.2

4.3

4.8

6.7

A . 3.25 B . 2.6 C . 2.2 D . 0
随着移动互联网的快速发展,基于互联网的共享单车应运而生.某市场研究人员为了了解共享单车运营公司 的经营状况,对该公司最近六个月内的市场占有率进行了统计,并绘制了相应的折线图.

 

(Ⅰ)由折线图得,可用线性回归模型拟合月度市场占有率 与月份代码 之间的关系.求 关于 的线性回归方程,并预测 公司2017年5月份(即 时)的市场占有率;

(Ⅱ)为进一步扩大市场,公司拟再采购一批单车.现有采购成本分别为1000元/辆和1200元/辆的 两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致车辆报废年限各不形同,考虑到公司运营的经济效益,该公司决定先对两款车型的单车各100辆进行科学模拟测试,得到两款单车使用寿命频数表见上表.

经测算,平均每辆单车每年可以带来收入500元,不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整年,且以频率作为每辆单车使用寿命的概率,如果你是 公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?

(参考公式:回归直线方程为 ,其中

设某大学的女生体重 (单位: )与身高 (单位: )具有线性相关关系,根据一组样本数据 ,用最小二乘法建立的回归方程为 ,则下列结论中不正确的是(    )
A . 具有正的线性相关关系 B . 回归直线过样本点的中心 C . 若该大学某女生身高增加 ,则其体重约增加 D . 若该大学某女生身高为 ,则可断定其体重必为
为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1 , l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是 (   )
A . 直线l1和l2有交点(s,t) B . 直线l1和l2相交,但是交点未必是点(s,t)D.直线l1和l2必定重合 C . 直线l1和l2由于斜率相等,所以必定平行
某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局和某医院抄录了1至6月份每月10号的昼夜温差的情况与患感冒就诊的人数,得到如下资料:

日期

1月10号

2月10号

3月10号

4月10号

5月10号

6月10号

昼夜温差x(℃)

10

11

13

12

8

6

就诊人数y(人)

22

25

29

26

16

12

该兴趣小组确定的研究方案是先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选出的2组数据进行检验.

附;

  1. (1) 若选取的是1月和6月的两组数据,请根据2月至5月的数据求出 于的线性回归方程;
  2. (2) 若由线性回归方程得到的估计数,与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的.试问:该小组所得的线性回归方程是否理想?
近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农户的数据,进行回归分折,得到两个回归摸型:模型①: ,模型②: ,对以上两个回归方程进行残差分析,得到下表:

种植面积 (亩)

2

3

4

5

7

9

每亩种植管理成本 (百元)

25

24

21

22

16

14

模型①

估计值

25.27

23.62

21.97

17.02

13.72

残差

-0.27

0.38

-0.97

-1.02

0.28

模型②

26.84

20.17

18.83

17.31

16.46

-1.84

0.83

3.17

-1.31

-2.46

  1. (1) 将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;
  2. (2) 视残差 的绝对值超过1.5的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求回归方程.

    附:

某公司为了解某产品的获利情况,将今年1至7月份的销售收入 (单位:万元)与纯利润 (单位:万元)的数据进行整理后,得到如下表格:

月份

1

2

3

4

5

6

7

销售收入

13

13.5

13.8

14

14.2

14.5

15

纯利润

3.2

3.8

4

4.2

4.5

5

5.5

该公司先从这7组数据中选取5组数据求纯利润 关于销售收入 的线性回归方程,再用剩下的2组数据进行检验.假设选取的是2月至6月的数据.

参考公式: ;参考数据: .

  1. (1) 求纯利润 关于销售收入 的线性回归方程(精确到0.01);
  2. (2) 若由线性回归方程得到的估计数据与检验数据的误差均不超过0.1万元,则认为得到的线性回归方程是理想的.试问该公司所得线性回归方程是否理想?
随着科技进步,近来年,我国新能源汽车产业迅速发展.以下是中国汽车工业协会2022年2月公布的近六年我国新能源乘用车的年销售量数据:

年份

2016

2017

2018

2019

2020

2021

年份代码x

1

2

3

4

5

6

新能源乘用车年销售y(万辆)

50

78

126

121

137

352

参考数据:设u=lny,其中ui=lnyi

 

 

 

 

e3.63

e5.94

e6.27

144

4.78

841

5.70

37.71

380

528

参考公式:对于一组具有线性相关关系的数据(xi , yi)(i=1,2,3,⋅⋅⋅,n),其回归直线 的斜率和截距的最小二乘估计公式分别为

  1. (1) 根据表中数据,求出y关于x的线性回归方程;(结果保留整数)
  2. (2) 若用y=menx模型拟合y与x的关系,可得回归方程为 ,请分别利用(1)与(2)中两个模型,求2022年我国新能源乘用车的年销售量的预测值;