统计与统计案例 知识点题库

在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据都加2后所得数据,则A,B两样本的下列数字特征对应相同的是(  )

A . 众数 B . 平均数 C . 中位数 D . 方差
在2010年3月15日那天,哈市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:

价格x

9

9.5

10

10.5

11

销售量y

11

10

8

6

5

由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归直线方程是;y=﹣3.2x+a,(参考公式:回归方程:y=bx+a,a=),则a=(  )

A . -24 B . 35.6 C . 40.5 D . 40
某公司为了解用户对其产品的满意度,从某地区随机调查了100个用户,得到用户对产品的满意度评分频率分布表如下:

组别

分组

频数

频率

第一组

(50,60]

10

0.1

第二组

(60,70]

20

0.2

第三组

(70,80]

40

0.4

第四组

(80,90]

25

0.25

第五组

(90,100)

5

0.05

合计

100

1

  1. (1) 根据上面的频率分布表,估计该地区用户对产品的满意度评分超过70分的概率;
  2. (2) 请由频率分布表中数据计算众数、中位数,平均数,根据样本估计总体的思想,若平均分低于75分,视为不满意.判断该地区用户对产品是否满意?
根据样本数据得到回归直线方程 ,其中 =9.1,则 =(  )

x

4

2

3

5

y

49

26

39

54

A . 9.4 B . 9.5 C . 9.6 D . 9.7
某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为

图片_x0020_2101253130

  1. (1) 求频率分布直方图中 的值;
  2. (2) 估计该企业的职工对该部门评分不低于80的概率;
  3. (3) 从评分在 的受访职工中,随机抽取2人,求此2人评分都在 的概率.
某次歌唱比赛中,7位评委为某选手打出的分数分别为83,91,91,94,94,95,96,去掉一个最高分和一个最低分后,所剩数据的平均数为(  )
A . 94 B . 93 C . 92 D . 91
已知某区中小学学生人数如图所示,为了解该区学生参加某项社会实践活动的意向,拟采用分层抽样的方法来进行调查.若高中需抽取20名学生,则小学与初中共需抽取的学生人数为名.

图片_x0020_100002

某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:

年份

2007

2008

2009

2010

2011

2012

2013

年份代号t

1

2

3

4

5

6

7

人均纯收入y

2.9

3.3

3.6

4.4

4.8

5.2

5.9

附:回归直线的斜率和截距的最小二乘估计公式分别为:

  1. (1) 求y关于t的线性回归方程;
  2. (2) 利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
某学生为了测试煤气灶烧水如何节省煤气的问题设计了一个实验,并获得了煤气开关旋钮旋转的弧度数x与烧开一壶水所用时间y的一组数据,且作了一定的数据处理(如表),得到了散点图(如图).

表中 .

附:对于一组数据 ,…, ,其回归直线 的斜率和截距的最小二乘估计分别为 .

  1. (1) 根据散点图判断, 哪一个更适宜作烧水时间y关于开关旋钮旋转的弧度数x的回归方程类型?(不必说明理由)
  2. (2) 根据判断结果和表中数据,建立y关于x的回归方程;
  3. (3) 若旋转的弧度数x与单位时间内煤气输出量t成正比,那么x为多少时,烧开一壶水最省煤气?
已知x,y的线性回归直线方程为 ,且x,y之间的一组相关数据如下表所示,则下列说法错误的为(   )

图片_x0020_1790264752

A . 变量x,y之间呈现正相关关系 B . 可以预测,当 时, C . D . 由表格数据可知,该回归直线必过点
某产品的广告费用x与销售额y的统计数据如下表:

广告费用x(万元)

4

2

3

5

销售额 图片_x0020_100002 (万元)

49

26

39

54

根据上表可得回归方程 中的 为9.4,据此模型预报广告费用为6万元时销售额为(   )

A . 63.6万元 B . 65.5万元 C . 67.7万元 D . 72.0万元
某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)

图片_x0020_100003

参考公式:

0.05

0.025

0.010

0.005

0.001

3.841

5.024

6.635

7.879

10.828

  1. (1) 根据以上数据完成下列 的列联表;

    主食蔬菜

    主食肉类

    合计

    50岁以下

    50岁以上

    合计

  2. (2) 能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.
经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y(万元)、年份及其编号t,有如下统计资料:

年份

2014

2015

2016

2017

2018

2019

t

1

2

3

4

5

6

y

9.5

12.2

14.6

17.4

19.6

m

已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y与年份编号t呈线性相关关系.

  1. (1) 求2019年该公司的经营费用;
  2. (2) y关于t的回归方程为 ,求 ,并预测2020年所需要支出的经营费用;
  3. (3) 该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:

    图片_x0020_355279544

    预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润 销售利润 经营费用).

有两个分类变量 ,其中一组观测值为如下的2×2列联表:

总计

15

50

总计

20

45

65

其中 均为大于5的整数,则 时,在犯错误的概率不超过 的前提下为“ 之间有关系”.附:

P(K2≥k)

0.10

0.05

0.025

0.010

0.005

k

2.706

3.841

5.024

6.635

7.879

如图,根据已知的散点图,得到y关于x的线性回归方程为 ,则 (    )

A . 1.5 B . 1.8 C . 2 D . 1.6
某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样的方法抽一个容量为7的样本,其中30岁以上的员工应抽多少(   )
A . 2人 B . 4人 C . 5人 D . 1人
某电器企业统计了近 年的年利润额 (千万元)与投入的年广告费用 (十万元)的相关数据,散点图如图,对数据作出如下处理:令 ,得到相关数据如表所示:

  1. (1) 从① ;② ;③ 三个函数中选择一个作为年广告费用 和年利润额 的回归类型,判断哪个类型符合,不必说明理由;
  2. (2) 根据(1)中选择的回归类型,求出 的回归方程;
  3. (3) 预计要使年利润额突破 亿,下一年应至少投入多少广告费用?(结果保留到万元)

    参考数据: .

    参考公式:回归方程 中斜率和截距的最小二乘估计公式分别为 .

研究表明,子女的平均身高 与父母的平均身高 有较强的线性相关性.某数学小组收集到8个家庭的相关数据,下面是小组制作的统计图散点图、回归直线及回归方程)与原始数据表(局部缺失):

家庭编号

1

2

3

4

5

6

7

8

父母平均身高(

160.5

165

167

170

170.5

173

174

180

子女平均身高(

168

170

172.5

187

174.5

176

180

*

  1. (1) 表中8号家庭的子女平均身高数据缺失,试根据统计学知识找回该数据:
  2. (2) 由图中观察到4号家庭的数据点明显偏离回归直线l,试计算其残差(残差=观测值-预报值)

    若剔除4号家庭数据点后,用余下的7个散点作线性回归分析,得到新的回归直线 ,判断并证明l与 的位置关系.

    附:对于一组数据 ,…, ,其回归直线 的斜率和截距的最小二乘估计分别为:

为了提高全市市民的疫情防控意识,某市抽取了名市民进行常态化防控知识问卷调查,根据问卷得分制成的频率分布直方图如图所示,问卷得分分组区间是 , 根据图中信息,下列说法正确的是( )

A . 图中的值为0.01 B . 得分在80分及以上的人数为250 C . 这组数据的极差为50 D . 这组数据中位数的估计值(精确到0.1)为71.7
某市教育局为了解疫情时期网络教学期间的学生学习情况,从该市随机抽取了1000名高中学生,对他们每天的平均学习时间进行问卷调查,根据所得信息制作了如图所示的频率分布直方图,根据此图,估计该市高中学生每天的平均学习时间的60%分位数为小时.

最近更新