回归分析 知识点题库

下列说法正确的有                                                 (   )
①回归方程适用于一切样本和总体。    
②回归方程一般都有时间性。
③样本取值的范围会影响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。

A . ①② B . ②③ C . ③④ D . ①③
在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是     (     )

A . 总偏差平方和 B . 残差平方和 C . 回归平方和 D . 相关指数R2
为了表示n个点与相应直线在整体上的接近程度,我们常用(    )表示

A . B . C . D .
下列关于由最小二乘法求出的回归直线方程 =2-x的说法中,不正确的是(  )

A . 变量x与y正相关 B . 该回归直线必过样本点中心( C . 当x=l时,y的预报值为l D . 当残差平方和越小时模型拟合的效果越好

给出下列五个命题:
①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;
②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;
③一组数据为a,0,1,2,3,若该组数据的平均值为1,则样本标准差为2;
④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y=a+bx中,则a=1;
⑤如图是根据抽样检测后得出的产品样本净重(单位:克)数据绘制的频率分布直方图,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是90.

其中真命题为( )

A . ①②④ B . ②④⑤ C . ②③④ D . ③④⑤
有下列说法:

①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;

②用相关指数 来刻画回归效果, 的值越大,说明模型的拟合效果越好;

③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小,拟合效果越好.

其中正确命题的个数是(    )

A . 0 B . 1 C . 2 D . 3
下列说法不正确的是(    )
A . 回归分析中,相关指数R2的值越大,说明残差平方和越小 B . 若一组观测值(x1y1),(x2y2),…,(xnyn)满足yibxiaeii=1,2,…,n),若ei恒为0,则R2=1 C . 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法 D . 画残差图时,纵坐标为残差,横坐标一定是编号
某车间加工零件的数量x与加工时间y的统计数据如下表:


现已求得上表数据的回归方程=x+中的的值为0.9,则据此回归模型可以预测,加工90个零件所需要的加工时间约为(  )

A . 93分钟 B . 94分钟 C . 95分钟 D . 96分钟
某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到数据如表.预计在今后的销售中,销量与单价仍然服从=bx+a( b=﹣20,a=﹣b)的关系,且该产品的成本是4元/件,为使工厂获得最大利润(利润=销售收入﹣成本),该产品的单价应定为(  )元.

单价x(元)

8

8.2

8.4

8.6

8.8

9

销量y(件)

90

84

83

80

75

68

A . B . 8 C . D .
下列结论正确的是(   )

①函数关系是一种确定性关系;

②相关关系是一种非确定性关系;

③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;

④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.

A . ①② B . ①②③ C . ①②④ D . ①②③④
两个变量 的回归模型中,分别选择了 个不同模型,它们对应的 的值如下,其中拟合效果最好的模型是(   )
A . 模型 对应的 B . 模型 对应的 C . 模型 对应的 D . 模型 对应的
为研究某种图书每册的成本费 (元)与印刷数 (千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.

表中 .

(附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为

  1. (1) 根据散点图判断: 哪一个更适宜作为每册成本费 (元)与印刷数 (千册)的回归方程类型?(只要求给出判断,不必说明理由)
  2. (2) 根据(1)的判断结果及表中数据,建立 关于 的回归方程(回归系数的结果精确到0.01);
  3. (3) 若每册书定价为10元,则至少应该印刷多少千册才能使销售利润不低于78840元?(假设能够全部售出,结果精确到1)
某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量 与尺寸 之间近似满足关系式 ( 为大于0的常数).现随机抽取6件合格产品,测得数据如下:

对数据作了初步处理,相关统计位的值如下表:

  1. (1) 根据所给数据,求 关于 的回归方程;
  2. (2) 按照某项指标测定,当产品质量与尺寸的比在区间 内时为优等品.现从抽取的6件合格产品中再任选3件,记 为取到优等品的件数,试求随机变量 的分布列和期望.

    附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为 .

我校的课外综合实践研究小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到市气象观测站与市博爱医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:

日    期

1月10日

2月10日

3月10日

4月10日

5月10日

6月10日

昼夜温差 (℃)

10

11

13

12

8

6

就诊人数  (个)

22

25

29

26

16

12

该综合实践研究小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.

参考数据:

.

参考公式:回归直线 ,其中 .

  1. (1) 若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出 关于 的线性回归方程
  2. (2) 若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
如图所示,5组数据 中去掉 后,下列说法错误的是(   )

图片_x0020_1241016330

A . 残差平方和变大 B . 相关系数 变大 C . 相关指数 变大 D . 解释变量x与预报变量y的相关性变强
下列有关相关指数 的说法正确的是(   )
A . 越接近 ,表示回归效果越差 B . 的值越大,说明残差平方和越小 C . 越接近 ,表示回归效果越好 D . 的值越小,说明残差平方和越小
一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下:

零件数x(个)

10

20

30

40

50

60

70

80

90

100

加工时间y(分)

62

68

75

81

89

95

102

108

115

122

  1. (1) y与x是否具有线性相关关系?
  2. (2) 如果y与x具有线性相关关系,求回归直线方程;
  3. (3) 根据求出的回归直线方程,预测加工200个零件所用的时间为多少?

    附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线 = x+ 的斜率和截距的最小二乘估计分别为 = , = - .

给出下列命题,其中正确命题为(    )
A . 投掷一枚均匀的硬币和均匀的骰子(形状为正方体,六个面分别标有数字1,2,3,4,5,6)各一次,记硬币正面向上为事件A,骰子向上的点数是2为事件B,则事件A和事件B同时发生的概率为 B . 以模型 去拟合一组数据时,为了求出回归方程,设 ,将其变换后得到线性方程 ,则 的值分别是 C . 随机变量 服从正态分布 ,则 D . 某选手射击三次,每次击中目标的概率均为 ,且每次射击都是相互独立的,则该选手至少击中2次的概率为
从去年开始,全国各地积极开展“一盔一带”安全守护行动,倡导群众佩戴安全头盔、使用安全带.为了解相关的情况,某学习小组统计了国内20个城市的电动自行车头盔佩戴率 和电动自行车驾乘人员交通事故死亡率 ,并整理得到下面的散点图.

参考数据: .参考公式:相关系数 ,回归方程 中斜率和截距的最小二乘估计公式分别为: .

  1. (1) 求这20个城市的电动自行车头盔佩戴率大于50%的概率;
  2. (2) 通过散点图分析 的相关关系,说明佩戴安全头盔的必要性;
  3. (3) 有四名同学通过计算得到 的相关系数分别为0.97,0.62, ,请你从中选出最有可能正确的结果,并以此求出 关于 的线性回归方程.
为了研究某种病毒在特定环境下随时间变化的繁殖情况,得到了一些数据,绘制成散点图,发现用模型拟合比较合适.令 , 得到 , 经计算发现满足下表,则.

天数(天)

2

3

4

5

6

1.5

4.5

5.5

6.5

7