统计与统计案例 知识点题库

对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是(  )
A . B . C . D .
下列说法中,正确的是(  )

A . 数据5,4,4,3,5,2,1的中位数是3 B . 一组数据的标准差是这组数据的方差的平方 C . 频率分布直方图中各小长方形的面积等于相应各组的频数 D . 数据2,3,4,5 的标准差是数据4,6,8,10的标准差的一半
重庆市2013年各月的平均气温(℃)数据的茎叶图如,则这组数据的中位数是(   )

A . 19 B . 20 C . 21.5 D . 23
电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

  1. (1) 根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?

    非体育迷

    体育迷

    合计

    10

    55

    合计

    附:K2=

    P(K2≥k)

    0.05

    0.01

    k

    3.841

    6.635

  2. (2) 将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).

某超市从现有甲、乙两种酸奶的日销售量(单位:箱)的1200个数据(数据均在区间(0,50]内)中,按照5%的比例进行分层抽样,统计结果按(0,10],(10,20],(20,30],(30,40],(40,50]分组,整理如下图:

(Ⅰ)写出频率分布直方图(图乙)中a的值;记所抽取样本中甲种酸奶与乙种酸奶日销售量的方差分别为 ,试比较 的大小(只需写出结论);

(Ⅱ)从甲种酸奶日销售量在区间(0,20]的数据样本中抽取3个,记在(0,10]内的数据个数为X,求X的分布列;

(Ⅲ)估计1200个日销售量数据中,数据在区间(0,10]中的个数.

如图四个散点图中,适合用线性回归模型拟合其中两个变量的是(   )
A . ①② B . ①③ C . ②③ D . ③④
从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为
为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列表:

喜爱打篮球

不喜爱打篮球

合计

男生

20

5

25

女生

10

15

25

合计

30

20

50

  1. (1) 用分层抽样的方法在喜欢打篮球的学生中抽6人,其中男生抽多少人?
  2. (2) 在上述抽取的6人中选2人,求恰有一名女生的概率.
  3. (3) 为了研究喜欢打篮球是否与性别有关,计算出K2 , 你有多大的把握认为是否喜欢打篮球与性别有关?

    附:

    下面的临界值表供参考:

    p(K2≥k)

    0.15

    0.10

    0.05

    0.025

    0.010

    0.005

    0.001

    k

    2.072

    2.706

    3.841

    5.024

    6.635

    7.879

    10.828

我校高二年级共2000名学生,其中男生1200人.为调查学生们的手机使用情况,采用分层抽样的方法,随机抽取100位学生每周平均使用手机上网时间的样本数据(单位:小时).根据这100个数据,得到学生每周平均使用手机上网时间的频率分布直方图(如图所示),其中样本数据分组区间分别为 .

  1. (1) 应收集男生、女生样本数据各多少人?
  2. (2) 估计我校高二年级学生每周平均使用手机上网时间超过4小时的概率.
  3. (3) 将平均每周使用手机上网时间在 内定义为“长时间使用手机”,在 内定义为“短时间使用手机”.在样本数据中,有25名学生不近视.请完成下列2×2列联表,并判断是否有99.5%的把握认为“学生每周使用手机上网时间与近视程度有关”.


    近视

    不近视

    合计

    长时间使用手机上网




    短时间使用手机上网


    15


    合计


    25


    附:

    0.100

    0.050

    0.010

    0.005

    2.706

    3.841

    6.635

    7.879

一只红铃虫的产卵数 和温度 有关,现收集了 组观测数据列于下表中,根据数据作出散点图如下:

温度 /℃

        

        

        

        

产卵数 /个

         

        

        

       

(I)根据散点图判断 哪一个更适宜作为产卵数 关于温度 的回归方程类型?(给出判断即可,不必说明理由)

(II)根据(I)的判断结果及表中数据,建立 关于 的回归方程(数字保留 位小数);

(III)要使得产卵数不超过 ,则温度控制在多少℃以下?(最后结果保留到整数)

参考数据:

          

         

        

        

       

     

       

         

       

       

《最强大脑》是江苏卫视引进德国节目《Super Brain》而推出的大型科学竞技真人秀节目,节目筹备组透露挑选选手的方式:不但要对空间感知、照相式记忆进行考核,而且要让选手经过名校最权威的脑力测试, 分以上才有机会入围,某重点高校准备调查脑力测试成绩是否与性别有关,在该高校随机抽取男、女学生各 名,然后对这 名学生进行脑力测试,规定:分数不小于 分为“入围学生”,分数小于 分为“未入围学生”,已知男生入围 人,女生未入围 人,
  1. (1) 根据题意,填写下面的 列联表,并根据列联表判断是否有 以上的把握认为脑力测试后是否为“入围学生”与性别有关.

    性别

    入围人数

    未入围人数

    总计

    男生

    24

    女生

    80

    总计

  2. (2) 用分层抽样的方法从“入围学生”中随机抽取 名学生.

    (ⅰ)求这 名学生中女生的人数;

    (ⅱ)若抽取的女生的脑力测试分数各不相同(每个人的分数都是整数),求这 名学生中女生测试分数的平均分的最小值.

    附: ,其中

     

    0.10

    0.05

    0.025

    0.010

    0.005

    0.001

         

    2.706

    3.841

    5.024

    6.635

    7.879

    10.828

将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图,后来有1个数据模糊,无法辨认,在图中以x表示,则5个剩余分数的方差为.

图片_x0020_100011

在全面抗击新冠肺炎疫情这一特殊时期,我市教育局提出“停课不停学”的口号,鼓励学生线上学习.某校数学教师为了调查高三学生数学成绩与线上学习时间之间的相关关系,对高三年级随机选取45名学生进行跟踪问卷,其中每周线上学习数学时间不少于5小时的有19人,余下的人中,在检测考试中数学平均成绩不少于120分的有10人,统计成绩后得到如下 列联表:

分数不少于120分

分数不足120分

合计

线上学习时间不少于5小时

4

19

线上学习时间不足5小时

10

合计

45

(下面的临界值表供参考)

0.10

0.05

0.025

0.010

0.005

0.001

2.706

3.841

5.024

6.635

7.879

10.828

(参考公式 其中

  1. (1) 请完成上面 列联表;并判断是否有99%的把握认为“高三学生的数学成绩与学生线上学习时间有关”;
  2. (2) 在上述样本中从分数不少于120分的学生中,按照分层抽样的方法,抽到线上学习时间不少于5小时和线上学习时间不足5小时的学生共5名,若在这5名学生中随机抽取2人,其中每周线上学习时间不足5小时的人数为 ,求 的分布列及其数学期望.
为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为25的样本,则分组数和分段的间隔分别为(    )
A . 50,20 B . 40,25 C . 25,40 D . 20,50
2020年底某网购公司为了解会员对售后服务(包括退货、换货、维修等)的满意度,从2020年下半年的会员中随机调查了20个会员,得到会员对售后服务满意度评分的雷达图如图所示.规定评分不低于80分为满意,否则为不满意.

  1. (1) 求这20个会员对售后服务满意的频率;
  2. (2) 以(1)中的频率作为所有会员对该公司售后服务满意的概率,假设每个会员的评价结果相互独立,现从下半年的所有会员中随机选取3个会员.

    (i)求只有1个会员对售后服务不满意的概率;

    (ii)记这3个会员中对售后服务满意的会员的个数为 ,求 的数学期望与标准差(标准差的结果精确到0.1).

下列说法中表述恰当的是(    )
A . 用相关指数 来刻画回归效果, 值越接近于0,说明模型的拟合效果越好 B . 已知变量 之间的线性回归方程为 ,则相关系数 C . 开式中,二项式系数最大的项是首末两项 D . 离散型随机变量的各个可能值表示的事件是彼此互斥的
海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示,工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.

地区

A

B

C

数量/件

50

150

100

  1. (1) 求这6件样品中来自A,B,C三个地区商品的数量;
  2. (2) 若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.
为了解学生的课外阅读情况,某校采用样本量比例分配的分层随机抽样对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:

年级

抽样人数

样本平均数

样本方差

高一

40

5

3.5

高二

30

2

高三

30

3

已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数 ,高三年级学生的样本方差 .

一组5个数据的和为25,方差为6,则 , 5这6个数的方差为( )
A . 5 B . 6 C . 25 D . 30
某公司加班加点生产口罩,防护服,消毒水等防疫物品.在加大生产的同时,该公司狠抓质量管理,不定时抽查口罩质量,质检人员从所生产的口罩中随机抽取了100个,将其质量指标值分成以下六组: , …, , 得到如下频率分布直方图.

  1. (1) 求出直方图中m的值;
  2. (2) 利用样本估计总体的思想,估计该企业所生产的口罩的质量指标值的平均数和中位数(同一组中的数据用该组区间中点值作代表,中位数精确到0.01).
最近更新