如图所示,图中有5组数据,去掉 组数据后(填字母代号),剩下的4 组数据的线性相关性最强( )
①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程 ,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( )
第x天 | 1 | 2 | 3 | 4 | 5 |
被感染的计算机数量y(台) | 10 | 20 | 39 | 81 | 160 |
则下列函数模型中能较好地反映计算机在第x天被感染的数量y与x之间的关系的是( )
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选择的模型比较合适;
②用相关指数可以刻画回归的效果,值越大说明模型的拟和效果越好;
③比较两个模型的拟和效果,可以比较残差平方和的大小,残差平方和越小的模型拟和效果越好.
其中说法正确的个数为( )
日期 | 9月5日 | 10月3日 | 10月8日 | 11月16日 | 12月21日 |
气温x(℃) | 18 | 15 | 11 | 9 | ﹣3 |
用水量y(吨) | 57 | 46 | 36 | 37 | 24 |
(Ⅰ)若从这随机统计的5天中任取2天,求这2天中有且只有1天用水量低于40吨的概率(列出所有的基本事件);
(Ⅱ)由表中数据求得线性回归方程=
x+
中的
, 试求出
的值,并预测当地气温为5℃时,该生活小区的用水量.
年份 | 第1年 | 第2年 | 第3年 | 第4年 | 第5年 |
需求量(万吨) | 3 | 6 | 5 | 7 | 8 |
(Ⅰ)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;
(Ⅱ)利用(Ⅰ)中所求出的直线方程预测该地第6年的粮食需求量.
x | 2 | 3 | 4 | 5 | 6 |
y | 2.2 | 3.8 | 5.5 | 6.5 | 7.0 |
试求:
①从 类用户中任意抽取1户,求其打分超过85分的概率;
②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有 的把握认为“满意度与用电量高低有关”?
满意 | 不满意 | 合计 | |
| |||
| |||
合计 |
附表及公式:
0.050 | 0.010 | 0.001 | |
3.841 | 6.635 | 10.828 |
,
.
附:线性回归方程 中,
,
.
参考数据: ,
.
(ⅰ)试求 与
之间的线性回归方程;
(ⅱ)预测当 店日纯利润不低于2万元时,
店日纯利润的大致范围(精确到小数点后两位);
则实数 ( )
时间 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期日 |
车流量 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 28 | 30 | 35 | 41 | 49 | 56 | 62 |
①残差平方和越小的模型,拟合的效果越好;②用相关指数 来刻画回归效果,
越小说明拟合效果越好;③线性回归方程对应的直线
至少经过其样本数据点中的一个点;④若变量
和
之间的相关系数为
,则变量
和
之间的负相关很强.以上正确说法的个数是( )
①若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变;②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;③设随机变量 服从正态分布
,若
,则
;④对分类变量
与
的随机变量
的观测值
来说,
越小,判断“
与
有关系”的把握越大.其中正确的命题序号是( )
月份x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
销量y | 6 | 11 | 21 | 34 | 66 | 101 | 196 |
参考数据:
62.14 | 1.54 | 2535 | 50.12 | 3.47 |
其中 ,
.
参考公式:
对于一组数据 ,
, …,
, 其回归直线
的斜率和截距的最小二乘估计公式分别为:
,
.