回归分析 知识点题库

为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2 , 已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是(  )

A . l1和l2必定平行 B . l1与l2必定重合 C . l1和l2有交点(s,t) D . l1与l2相交,但交点不一定是(s,t)
据某市地产数据研究院的数据显示,2016年该市新建住宅销售均价走势如图所示,为抑制房价过快上涨,政府从8月份采取宏观调控措施,10月份开始房价得到很好的抑制.

参考数据: ,(说明:以上数据 为3月至7月的数据)

回归方程 中斜率和截距的最小二乘估计公式分别为:

  1. (1) 地产数据研究院研究发现,3月至7月的各月均价 (万元/平方米)与月份 之间具有较强的线性相关关系,试建立 关于 的回归方程(系数精确到 0.01),政府若不调控,依次相关关系预测第12月份该市新建住宅销售均价;
  2. (2) 地产数据研究院在2016年的12个月份中,随机抽取三个月份的数据作样本分析,若关注所抽三个月份的所属季度,记不同季度的个数为X,求X的分布列和数学期望.

两个线性相关变量x与y的统计数据如表:

x

9

9.5

10

10.5

11

y

11

10

8

6

5

其回归直线方程是 ,则相对应于点 的残差 为(    )

A . 0.1 B . 0.2 C . ﹣0.1 D . ﹣0.2
一研究性学习小组对春季昼夜温差大小与某大豆种子发芽多少之间的关系进行分析研究,他们分别记录了4月1日至4月5日的每天昼夜温差与实验室每天每100颗种子的发芽数,得到如下数据:

日期

4月1日

4月2日

4月3日

4月4日

4月5日

温差 摄氏度

8

12

13

11

10

发芽数

18

26

30

25

20

该学习组所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再用被选取的2组数据进行检验.

参考公式和数据:

  1. (1) 求选取的2组数据恰好是相邻2天的数据的概率;
  2. (2) 若选取的是4月1日与4月5日这2组数据做检验,请根据4月2日至4月4日这3组数据求出 关于 的线性回归方程
  3. (3) 若由线性回归方程得到的估计数据与所选出的检验数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)所得的线性回归方程是否可靠?
已知四个命题:

①在回归分析中, 可以用来刻画回归效果, 的值越大,模型的拟合效果越好;②在独立性检验中,随机变量 的值越大,说明两个分类变量有关系的可能性越大;③在回归方程 中,当解释变量 每增加1个单位时,预报变量 平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;其中真命题是(    )

A . ①④ B . ②④ C . ①② D . ②③