回归分析 知识点题库

如图所示,图中有5组数据,去掉   组数据后(填字母代号),剩下的4 组数据的线性相关性最强(   )

A . B . C . D .
在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟和效果最好的模型是(    )

A . 模型1的相关指数R2为0.25 B . 模型2的相关指数R2为0.50 C . 模型3的相关指数R2为0.98 D . 模型4的相关指数R2为0.80
工人月工资y(元)与劳动生产率x(千元)变化的回归方程 , 下列判断正确的是  (     ) 
①劳动生产率为1千元时,工资约为130元 
②劳动生产率提高1千元时,月工资约提高80元 
③劳动生产率提高1千元时,月工资约提高130元 
④当月工资为210元时,劳动生产率约为2千元 

A . ① ②  B . ① ② ④  C . ② ④  D . ① ② ③ ④
有下列说法:

①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程 ,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是(    )

A . 1 B . 2 C . 3 D . 4
某种计算机病毒是通过电子邮件进行传播的,下表是某公司前5天监测到的数据:

第x天

1

2

3

4

5

被感染的计算机数量y(台)

10

20

39

81

160

则下列函数模型中能较好地反映计算机在第x天被感染的数量y与x之间的关系的是(  )

A . y=10x  B . y=5x2﹣5x+10 C . y=5•2x D . y=10log2x+10
在进行回归分析时,预报变量的变化由(  )决定.

A . 解释变量 B . 残差变量 C . 解释变量与残差变量 D . 都不是
下列说法:

①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选择的模型比较合适;

②用相关指数可以刻画回归的效果,值越大说明模型的拟和效果越好;

③比较两个模型的拟和效果,可以比较残差平方和的大小,残差平方和越小的模型拟和效果越好.

其中说法正确的个数为(  )

A . 0个 B . 1个 C . 2个 D . 3个
研究性学习小组为了解某生活小区居民用水量y(吨)与气温x(℃)之间的关系,随机统计并制作了5天该小区居民用水量与当天气温的对应表:

日期

9月5日

10月3日

10月8日

11月16日

12月21日

气温x(℃)

18

15

11

9

﹣3

用水量y(吨)

57

46

36

37

24

(Ⅰ)若从这随机统计的5天中任取2天,求这2天中有且只有1天用水量低于40吨的概率(列出所有的基本事件);

(Ⅱ)由表中数据求得线性回归方程=x+中的 , 试求出的值,并预测当地气温为5℃时,该生活小区的用水量.

某地最近十年粮食需求量逐年上升,下表是部分统计数据:

年份

第1年

第2年

第3年

第4年

第5年

需求量(万吨)

3

6

5

7

8

(Ⅰ)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;

(Ⅱ)利用(Ⅰ)中所求出的直线方程预测该地第6年的粮食需求量.

假设某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:

x

2

3

4

5

6

y

2.2

3.8

5.5

6.5

7.0

试求:

  1. (1) y与x之间的回归方程;
  2. (2) 当使用年限为10年时,估计维修费用是多少?
从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如下.


  1. (1) 求频率分布直方图中 的值并估计这50户用户的平均用电量;
  2. (2) 若将用电量在区间 内的用户记为 类用户,标记为低用电家庭,用电量在区间 内的用户记为 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图:

    ①从 类用户中任意抽取1户,求其打分超过85分的概率;

    ②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有 的把握认为“满意度与用电量高低有关”?


    满意

    不满意

    合计

    类用户




    类用户




    合计




    附表及公式:

    0.050

    0.010

    0.001

    3.841

    6.635

    10.828

    .

某公司在某条商业街分别开有两家业务上有关联的零售商店,这两家商店的日纯利润变化情况如下表所示:

附:线性回归方程 中, .

参考数据: .

  1. (1) 从这几天的日纯利润来看,哪一家商店的日平均纯利润多些?
  2. (2) 由表中数据可以认为这两家商店的日纯利润之间有较强的线性相关关系.

    (ⅰ)试求 之间的线性回归方程;

    (ⅱ)预测当 店日纯利润不低于2万元时, 店日纯利润的大致范围(精确到小数点后两位);

  3. (3) 根据上述5日内的日纯利润变化情况来看,哪家商店经营状况更好?
已知变量 之间满足线性相关关系 ,且 之间的相关数据如下表所示:

则实数 (   )

A . 0.8 B . 0.6 C . 1.6 D . 1.8
为了探究车流量与 的浓度是否相关,现采集到华中某城市2015年12月份某星期星期一到星期日某一时间段车流量与 的数据如表:

时间

星期一

星期二

星期三

星期四

星期五

星期六

星期日

车流量 (万辆)

1

2

3

4

5

6

7

的浓度 (微克/立方米)

28

30

35

41

49

56

62

  1. (1) 求 关于 的线性回归方程;(提示数据:
  2. (2) (I)利用(1)所求的回归方程,预测该市车流量为12万辆时 的浓度;(II)规定:当一天内 的浓度平均值在 内,空气质量等级为优;当一天内 的浓度平均值在 内,空气质量等级为良,为使该市某日空气质量为优或者为良,则应控制当天车流量不超过多少万辆?(结果以万辆为单位,保留整数)参考公式:回归直线的方程是 ,其中 .
研究变量 得到一组样本数据,进行回归分析,有以下结论

①残差平方和越小的模型,拟合的效果越好;②用相关指数 来刻画回归效果, 越小说明拟合效果越好;③线性回归方程对应的直线 至少经过其样本数据点中的一个点;④若变量 之间的相关系数为 ,则变量 之间的负相关很强.以上正确说法的个数是(   )

A . B . C . D .
在一组样本数据 不全相等 的散点图中,若所有样本点 都在直线 上,则这组样本数据的样本相关系数为(    )
A . 3 B . 0 C . D . 1
下列命题:

①若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变;②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;③设随机变量 服从正态分布 ,若 ,则 ;④对分类变量 的随机变量 的观测值 来说, 越小,判断“ 有关系”的把握越大.其中正确的命题序号是(    )

A . ①② B . ①②③ C . ①③④ D . ②③④
两个变量 的回归模型中,分别选择了4个不同模型,它们的相关指数 如下,其中拟合效果最好的模型是(   )
A . 模型3的相关指数 为0.50 B . 模型2的相关指数 为0.80 C . 模型1的相关指数 为0.98 D . 模型4的相关指数 为0.25
2021年初某公司研发一种新产品并投入市场,开始销量较少,经推广,销量逐月增加,下表为2021年1月份到7月份,销量(单位:百件)与月份之间的关系.

月份x

1

2

3

4

5

6

7

销量y

6

11

21

34

66

101

196

参考数据:

62.14

1.54

2535

50.12

3.47

其中

参考公式:

对于一组数据 , …, , 其回归直线的斜率和截距的最小二乘估计公式分别为:

  1. (1) 画出散点图,并根据散点图判断(c,d均为大于零的常数)哪一个适合作为销量与月份的回归方程类型(给出判断即可,不必说明理由)?

  2. (2) 根据(1)的判断结果及表中的数据,求关于的回归方程,并预测2021年8月份的销量;
  3. (3) 考虑销量、产品更新及价格逐渐下降等因素,预测从2021年1月份到12月份(的取值依次记作1到12),每百件该产品的利润为元,求2021年几月份该产品的利润最大.
如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是(   )

A . 相关系数r变大 B . 残差平方和变大 C . 相关指数R2变小 D . 解释变量x与预报变量y的相关性变强