回归分析 知识点题库

线性回归方程=bx+a必过(  )

A . (0,0)点 B . (,0)点 C . (0,)点 D . ()点
设有一个回归直线方程 , 则变量x增加1个单位时(  )

A . y平均增加1.5个单位 B . y平均增加2个单位 C . y平均减少1.5个单位 D . y平均减少2个单位
实验测得四组的值分别为 , 则y关于x的线性回归方程必过点(  )

A . (2,8) B . (2.5,8) C . (10,31) D . (2.5,7.75)
在回归分析中,相关指数R2的值越大,说明残差平方和(    )
A . 越大 B . 越小 C . 可能大也可能小 D . 以上均错
实验测得四组(x,y)的值分别为(1,2),(2,3),(3,4),(4,4),则y与x间的线性回归方程是(  )

A . y=﹣1+x B . y=1+x   C . y=1.5+0.7x D . y=1+2x
下列结论正确的是(  )

①函数关系是一种确定性关系;

②在回归分析中,残差图中的纵坐标为残差;

③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;

④复数﹣1+i的共轭复数是﹣1﹣i.

A . ①② B . ①②③ C . ①②④ D . ①②③④
在研究两个变量的关系时,可以通过残差 , …,来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为 分析.

一工厂生产某种产品的月产量y(单位:万件)与月份x构成的实数对(x,y)在直线y=x+1附近,则估计3月份生产该产品 万件.

2015男篮亚锦赛决赛阶段,中国男篮以9连胜的不败战绩赢得第28届亚锦赛冠军,同时拿到亚洲唯一1张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛MVP(最有价值球员),如表是易建联在这9场比赛中投篮的统计数据.

比分

易建联技术统计

投篮命中

罚球命中

全场得分

真实得分率

中国91﹣42新加坡

3/7

6/7

12

59.52%

中国76﹣73韩国

7/13

6/8

20

60.53%

中国84﹣67约旦

12/20

2/5

26

58.56%

中国75﹣62哈萨克期坦

5/7

5/5

15

81.52%

中国90﹣72黎巴嫩

7/11

5/5

19

71.97%

中国85﹣69卡塔尔

4/10

4/4

13

55.27%

中国104﹣58印度

8/12

5/5

21

73.94%

中国70﹣57伊朗

5/10

2/4

13

55.27%

中国78﹣67菲律宾

4/14

3/6

11

33.05%

注:①表中a/b表示出手b次命中a次;

②TS%(真实得分率)是衡量球员进攻的效率,其计算公式为:

TS%=


(Ⅰ)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%超过50%的概率;

(Ⅱ)从上述9场比赛中随机选择两场,求易建联在这两场比赛中TS%至少有一场超过60%的概率;

(Ⅲ)用x来表示易建联某场的得分,用y来表示中国队该场的总分,画出散点图如图所示,请根据散点图判断y与x之间是否具有线性相关关系?结合实际简单说明理由.

为了研究某班学生的脚长 (单位厘米)和身高 (单位厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出 之间有线性相关关系,设其回归直线方程为 .已知 .该班某学生的脚长为24,据此估计其身高为(   )
A . 160 B . 163 C . 166 D . 170
某化工厂为预测产品的回收率 ,需要研究它和原料有效成分含量 之间的相关关系,现收集了4组对照数据。

3

4

5

6

2.5

3

4

4.5

(Ⅰ)请根据相关系数 的大小判断回收率 之间是否存在高度线性相关关系;

(Ⅱ)请根据上表提供的数据,用最小二乘法求出 关于 的线性回归方程 ,并预测当 时回收率 的值.

参考数据:

1

0

其他

相关关系

完全相关

不相关

高度相关

低度相关

中度相关

有下列数据:

x

1

2

3

y

3

5.99

12.01

下列四个函数中,模拟效果最好的为(   )

A . B . C . D .
《赢在博物馆》是中央电视台于2018 春节期间推出的全国首档大型益智类博物馆文物知识节目,中央电视台为了解该节目的收视情况,抽查北方与南方各5个城市,得到观看该节目的人数(单位:千人)如茎叶图所示,但其中一个数字被污损.

  1. (1) 若将被污损的数字视为0-9中10 个数字的随机一个,求北方观众平均人数超过南方观众平均人数的概率.
  2. (2) 该节目的播出极大激发了观众学习中国历史知识的热情,现在随机统计了4位观众每周学习中国历史知识的平均时间 (单位:小时)与年龄 (单位:岁),并制作了对照表(如下表所示):

    年龄

    20

    30

    40

    50

    每周学习中国历史知识平均时间

    2.5

    3

    4

    4.5

    由表中数据分析, 呈线性相关关系,试求线性同归方程 ,并预测年龄为60岁观众每周学习中国历史知识的平均时间.

    参考公式: .

下列说法正确的个数有 (     ) 

⑴已知变量 满足关系 ,则 正相关;(2)线性回归直线必过点  ;(3)对于分类变量 的随机变量 越大说明“ 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数 的值越大,说明拟合的效果越好.

A . 1 B . 2 C . 3 D . 4
进入冬天,大气流动性变差,容易形成雾握天气,从而影响空气质量.某城市环保部门试图探究车流量与空气质量的相关性,以确定是否对车辆实施限行.为此,环保部门采集到该城市过去一周内某时段车流量与空气质量指数的数据如下表:

时间

周一

周二

周三

周四

周五

周六

周日

车流量(x万辆)

10

9

9.5

10.5

11

8

8.5

空气质量指数y

78

76

77

79

80

73

75

  1. (1) 根据表中周一到周五的数据,求 关于 的线性回归方程;
  2. (2) 若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是可靠的.请根据周六和周日数据,判定所得的线性回归方程是否可靠?

     附:回归方程 中斜率和截距最小二乘估计公式分别为:

        其中:

对两个变量进行回归分析,给出如下一组样本数据: ,下列函数模型中拟合较好的是(    )
A . B . C . D .
研究变量 得到一组样本数据,进行回归分析,以下说法正确的是(    )
A . 残差平方和越小的模型,拟合的效果越好; B . 用相关指数 来刻画回归效果, 越小说明拟合效果越好; C . 在回归直线方程 中,当解释变量 每增加1个单位时,预报变量 平均增加0.2个单位; D . 若变量 之间的相关系数为 ,则变量 之间的负相关很强.
在用最小二乘法进行线性回归分析时,有下列说法:

①由样本数据得到的线性回归方程 必过样本点的中心

②由样本点 ,…, 得到回归直线,则这些样本点都在回归直线上;

③利用 来刻画回归的效果, 的模型回归效果好;

④残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越低;

其中正确的结论是(    )

A . ①② B . ①③ C . ②③ D . ②④
为了调查成年人体内某种自身免疫力指标,去年七月某医院从在本院体检中心体检的成年人群中随机抽取了100人,按其免疫力指标分成如下五组: ,其频率分布直方图如图1所示.今年某医药研究所研发了一种疫苗,对提高该免疫力有显著效果.经临床检测,将自身免疫力指标比较低的成年人分为五组,各组分别按不同剂量注射疫苗后,其免疫力指标y与疫苗注射量x个单位具有相关关系,样本数据的散点图如图2所示.

附:对于一组样本数据 ,… ,其回归直线 的斜率和截距的最小二乘估计值分别为

  1. (1) 设去年七月该医院体检中心共接待5000名成年人体检,试估计这些体检人群中免疫力指标不低于30的人数,并说明理由;
  2. (2) 求体检中心抽取的100个人的免疫力指标平均值;
  3. (3) 由于大剂量注射疫苗会对身体产生一定的副作用,医学部门设定:自身免疫力指标较低的成年人注射疫苗后,其免疫力指标不应超过普通成年人群自身免疫力指标平均值的3倍.以体检中心抽取的100人作为普通人群的样本,据此估计,疫苗注射量不应超过多少个单位?
下列说法中正确的是(   )
A . 公式中的L和W具有相关关系 B . 回归直线恒过样本点的中心 C . 相关系数r的绝对值越接近1,则两个变量的相关性越强 D . 对分类变量x与y的随机变量来说,越小,判断“x与y有关系”的把握越大