回归分析 知识点题库

在线性回归模型y=bx+a+e中,下列说法正确的是(    )

A . y=bx+a+e是一次函数 B . 因变量y是由自变量x唯一确定的 C . 因变量y除了受自变量x的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e的产生 D . 随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生
人的年龄x与人体脂肪含量的百分数y的回归方程为=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量(  )

A . 一定20.3% B . 在20.3%附近的可能性比较大 C . 无任何参考数据 D . 以上解释都无道理
某校高二(6)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)构成如下数据(15,79),(23,97),(16,64),(24,92),(12,58).求得的回归直线方程为=2.5x+ , 则某同学每周学习20小时,估计数学成绩约为多少分?

某同学大学毕业后在一家公司上班,工作年限x和年收入y(万元),有以下的统计数据:

x

3

4

5

6

y

2.5

3

4

4.5

(Ⅰ)请画出上表数据的散点图;

(Ⅱ)根据上表提供的数据,用最小二乘法求得y关于x的线性回归方程为=0.7x+a,求a的值;

(Ⅲ)请你估计该同学第8年的年收入约是多少?

某印刷厂为了研究印刷单册书籍的成本y(单位:元)与印刷册数x(单位:千册)之间的关系,在印制某种书籍时进行了统计,相关数据见下表:

印刷册数 (千册)

2

3

4

5

8

单册成本 (元)

3.2

2.4

2

1.9

1.7

根据以上数据,技术人员分别借助甲、乙两种不同的回归模型,得到两个回归方程,方程甲: = ,方程乙: =

  1. (1) 为了评价两种模型的拟合效果,完成以下任务.

    ①完成下表(计算结果精确到0.1);

    印刷册数x(千册)

    2

    3

    4

    5

    8

    单册成本y(元)

    3.2

    2.4

    2

    1.9

    1.7

    模型甲

    估计值

     

    2.4

    2.1

     

    1.6

    残差

     

    0

    ﹣0.1

     

    0.1

    模型乙

    估计值

     

    2.3

    2

    1.9

     

    残差

     

    0.1

    0

    0

     

    ②分别计算模型甲与模型乙的残差平方和Q1及Q2 , 并通过比较Q1 , Q2的大小,判断哪个模型拟合效果更好.

  2. (2) 该书上市之后,受到广大读者热烈欢迎,不久便全部售罄,于是印刷厂决定进行二次印刷.根据市场调查,新需求量为8千册(概率0.8)或10千册(概率0.2),若印刷厂以每册5元的价格将书籍出售给订货商,问印刷厂二次印刷8千册还是10千册能获得更多利润?(按(1)中拟合效果较好的模型计算印刷单册书的成本)
在一次对人体脂肪百分比和年龄关系的研究中,研究人员获得如下一组样本数据:

 年龄x

 21

 24

 34

 41

 脂肪y

 9.5

 17.5

 24.9

 28.1

由表中数据求得y关于x的线性回归方程为 =0.6x ,若年龄x的值为45,则脂肪含量y的估计值为

某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.
如今我们的互联网生活日益丰富,除了可以很方便地网购,网上叫外卖也开始成为不少人日常生活中不可或缺的一部分,为了解网络外卖在 市的普及情况, 市某调查机构借助网络进行了关于网络外卖的问卷调查,并从参与调查的网民中抽取了200人进行抽样分析,得到表格(单位:人).

参考公式: ,其中 .

参考数据:

0.15

0.10

0.05

0.025

0.010

2.072

2.706

3.841

5.024

6.635

  1. (1) 根据表中数据,能否在犯错误的概率不超过0.15的前提下认为 市使用网络外卖的情况与性别有关?
  2. (2) ①现从所抽取的女网民中利用分层抽样的方法再抽取5人,再从这5人中随机选出了3人赠送外卖优惠券,求选出的3人中至少有2人经常使用网络外卖的概率;

    ②将频率视为概率,从 市所有参与调查的网民中随机抽取10人赠送礼品,记其中经常使用网络外卖的人数为 ,求 的数学期望和方差.

石嘴山三中最强大脑社对高中学生的记忆力x和判断力y进行统计分析,得下表数据

参考公式:

  1. (1) 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程  ,预测记忆力为9的同学的判断力.
  2. (2) 若记忆力增加5个单位,预测判断力增加多少个单位?
《中华人民共和国道路交通安全法》第47条的相关规定:机动车行经人行道时,应当减速慢行;遇行人正在通过人行道,应当停车让行,俗称“礼让斑马线”, 《中华人民共和国道路交通安全法》第90条规定:对不礼让行人的驾驶员处以扣3分,罚款50元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员“礼让斑马线”行为统计数据:

  1. (1) 请利用所给数据求违章人数 与月份 之间的回归直线方程 ,并预测该路口9月份的不“礼让斑马线”违章驾驶员人数;
  2. (2) 若从表中1月份和4月份的违章驾驶员中,采用分层抽样方法抽取一个容量为7的样本,再从这7人中任选2人进行交规调查,求抽到的两人恰好来自同一月份的概率.

    参考公式: .

经市场调查,某旅游线路票销售量 (张)与旅游单价 (元/张)负相关,则其回归方程可能是(   )
A . B . C . D .
菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的数据作了初步处理,得到下面的散点图及一些统计量的值.

y(微克)

   x(千克)


3

38

11

10

374

-121

-751

其中

(I)根据散点图判断, ,哪一个适宜作为蔬菜农药残量 与用水量 的回归方程类型(给出判断即可,不必说明理由);

(Ⅱ)若用解析式 作为蔬菜农药残量 与用水量 的回归方程,求出 的回归方程.(c,d精确到0.1)

(Ⅲ)对于某种残留在蔬菜上的农药,当它的残留量低于20微克时对人体无害,为了放心食用该蔬菜,请估计需要用多少千克的清水清洗一千克蔬菜?(精确到0.1,参考数据 )

附:参考公式:回归方程 中斜率和截距的最小二乘估计公式分别为:

某学校开展研究性学习活动,某同学获得一组实验数据如下表:

x

3

4

y

12

对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是   

A . B . C . D .
若变量 之间是线性相关关系,则由数据表得到的回归直线必过定点(    )

图片_x0020_100002

A . B . C . D .
下列说法错误的是(    )
A . 在回归分析中,回归直线始终过样本点( x1 , y1 ),( x2 , y2 ),…,( xn , yn ) 的中心( B . 若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于0 C . 在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高 D . 在线性回归模型中,相关指数R2越接近于1,说明回归的效果越好
对两个变量 进行回归分析,得到一组样本数据: ,则下列说法中不正确的是(    )
A . 由样本数据得到的回归方程 必过样本中心 B . 残差平方和越小的模型,拟合的效果越好 C . 用相关指数 来刻画回归效果, 越小,说明模型的拟合效果越好 D . 若变量 之间的相关系数为 ,则变量 之间具有线性相关关系
已知下列命题:①由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,若某人数学成绩优秀,则他有99%的可能物理成绩优秀;②在回归分析中,可用相关指数 的值判断模型的拟合效果, 越大,模型的拟合效果越好;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④若“ 是假命题, 是真命题,则命题p,q一真一假”.其中真命题的个数是(   )
A . 4 B . 3 C . 2 D . 1
机动车行经人行横道时,应当减速慢行:遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让行人”行为统计数据:

月份

1

2

3

4

5

违章驾驶员人数

120

105

100

95

80

  1. (1) 请利用所给数据求违章人数 与月份 之间的回归直线方程
  2. (2) 预测该路口9月份的不“礼让行人”违章驾驶员人数;
  3. (3) 交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:

    不礼让行人

    礼让行人

    驾龄不超过1年

    24

    16

    驾龄1年以上

    16

    14

    能否据此判断有97.5%的把握认为“礼让行人行为与驾龄有关?

    参考公式: .

    (其中

    P(x2≥k)

    0.15

    0.10

    0.05

    0.025

    0.010

    k

    2.072

    2.706

    3.841

    5.024

    6.635

下列命题中,正确的有(    )

①若平面 平面 ,平面 平面 ,则平面 平面

②“若 ,则 ”的逆否命题为真命题;

③在线性回归模型中,相关指数 表示解释变量 对于预报变量 的贡献率, 越接近于0,表示回归效果越好;

④两个模型中残差平方和越小的模型拟合的效果越好;

A . 0个 B . 1个 C . 2个 D . 3个
某商场2020年部分月份销售金额如下表:

月份x

2

4

6

8

10

销售金额y(单位:万元)

64

132

a

286

368

若用最小二乘法求得回归直线方程为 ,则 (    )

A . 198.2 B . 205 C . 211 D . 213.5