统计与统计案例 知识点题库

从2003件产品中选取50件,若采用下面的方法选取:先用简单随机抽样从2003件产品中剔除3件,剩下的2000件再按系统抽样的方法抽取,则每件产品被选中的概率(  )

A . 不都相等 B . 都不相等 C . 都相等,且为 D . 都相等,且为
从随机编号为0001,0002,…5000的5000名参加这次鹰潭市模拟考试的学生中用系统抽样的方法抽取一个样本进行成绩分析,已知样本中编号最小的两个编号分别为0018,0068,则样本中最大的编号应该是(  )

A . 4966 B . 4967 C . 4968 D . 4969
已知某组数据采用了四种不同的回归方程进行回归分析,则回归效果最好的相关指数R2的值是(  )

A . 0.97 B . 0.83 C . 0.32 D . 0.17
已知变量x与y正相关,且由观测数据算得样本平均数 =3, =3.5,则由该观测数据算得的线性回归方程可能是(  )

A . =0.4x+2.3 B . =2x﹣2.4 C . =﹣2x+9.5 D . =﹣0.3x+4.4
某校在2016年的自主招生考试成绩中随机抽取100名学生的笔试成绩,被抽取学生的成绩均不低于160分,且低于185分,如图是按成绩分组得到的频率分布直方图.

  1. (1) 为了能选拔出优秀的学生,该校决定在笔试成绩较高的第3组、第4组、第5组中用分层抽样的方法抽取6名学生进入第二轮面试,求第3,4,5组每组各抽取多少名学生进入第二轮面试;
  2. (2) 在(1)的前提下,学校决定在6名学生中随机抽取2名学生由考官A面试,求第4组至少有一名学生被考官A面试的概.
从2007名学生中选取50名参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下的2000人再按系统抽样的方法抽取,则每人入选的可能性(   )
A . 都相等,且为 B . 不全相等 C . 均不相等 D . 都相等,且为
《汉字听写大会》不断创收视新高,为了避免“书写危机”弘扬传统文化,某市对全市10万名市民进行了汉字听写测试,调查数据显示市民的成绩服从正态分布N(168,16).现从某社区居民中随机抽取50名市民进行听写测试,发现被测试市民正确书写汉字的个数全部在160到184之间,将测试结果按如下方式分成六组:第一组[160,164),第二组[164,168),…,第六组[180,184),如图是按上述分组方法得到的频率分布直方图.

  1. (1) 试评估该社区被测试的50名市民的成绩在全市市民中成绩的平均状况及这50名市民成绩在172个以上(含172个)的人数;
  2. (2) 在这50名市民中成绩在172个以上(含172个)的人中任意抽取2人,该2人中成绩排名(从高到低)在全市前130名的人数记为ξ,求ξ的数学期望.

    参考数据:若η~N(μ,σ2),则P(μ﹣σ<X<μ+σ)=0.6826,P(μ﹣2σ<X<μ+2σ)=0.9544,P(μ﹣3σ<X<μ+3σ)=0.9974.

下面茎叶图记录了在某项体育比赛中,九位裁判为一名选手打出的分数情况,则去掉一个最高分和一个最低分后,所剩数据的平均值为,方差为.

一支田径队有男运动员56人,女运动员42人,用分层抽样的方法从全体运动员中抽出一个容量为28的样本,需抽出的男运动员的人数为
某学校高三年级有学生1000名,经调查,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中抽查100名同学.如果以身高达到165厘米作为达标的标准,对抽取的100名学生进行统计,得到以下列联表:


身高达标

身高不达标

总计

积极参加体育锻炼

40



不积极参加体育锻炼


15


总计



100

参考公式:  ,

参考数据:

P(K2≥k)

0.25

0.15

0.10

0.05

0.025

0.010

0.001

k

1.323

2.072

2.706

3.841

5.024

6.635

10.828

  1. (1) 完成上表;
  2. (2) 能否有犯错率不超过0.05的前提下认为体育锻炼与身高达标有关系?( 的观测值精确到0.001).
一项研究机构培育一种新型水稻品种,首批培育幼苗2000株,株长均介于185mm-235mm,从中随机抽取100株对株长进行统计分析,得到如下频率分布直方图

附: ;若X: ,则

  1. (1) 求样本平均株长  和样本方差 (同一组数据用该区间的中点值代替);


  2. (2) 假设幼苗的株长X服从正态分布 N ,其中 近似为样本平均数 近似为样本方差 ,试估计2000株幼苗的株长位于区间(201,219)的株数;
  3. (3) 在第(2)问的条件下,选取株长在区间(201,219)内的幼苗进入育种试验阶段,若每株幼苗开花的概率为 ,开花后结穗的概率为 ,设最终结穗的幼苗株数为 ,求 的数学期望.
某校从参加高一年级期末考试的学生中抽出40名学生,将其成绩分成六段[40,50),[50,60)…[90,100]后画出如下部分频率分布直方图,观察图形的信息,回答下列问题:

  1. (1) 求第四小组的频率
  2. (2) 估计这次考试的平均分和中位数(精确到0.01);
  3. (3) 从成绩是40~50分及90~100分的学生中选两人,记他们的成绩分别为 ,求满足“ ”的概率.
在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间(142,153)上的运动员人数是(    )

A . 2 B . 3 C . 4 D . 3或4
某机构为了研究中学生的视力与体育活动的关系,随机调查了几名中学生,得到了他们每周体育活动的时间(单位: )和视力的一组数据:

每周体育活动时间

2

4

6

8

10

视力

4.0

4.2

4.6

5.0

5.2

参考公式:

(Ⅰ)根据以上数据,在下面的坐标系中画出散点图;

图片_x0020_100010

(Ⅱ)用最小二乘法求 之间的线性回归方程

从某歌唱比赛中抽取若干名选手的参赛成绩,绘制成如下的频率分布直方图.

图片_x0020_100006

  1. (1) 求这些选手的平均成绩 (同一组中数据用该组区间中点作代表);
  2. (2) 求这些选手的成绩的中位数.(精确到0.1)
某校为了解高三学生周末在家学习情况,随机抽取高三年级甲、乙两班学生进行网络问卷调查,统计了甲、乙两班各40人每天的学习时间(单位:小时),并将样本数据分成 五组,整理得到如下频率分布直方图:

参考公式: .

参考数据①:

0.050

0.010

0.001

3.841

6.635

10.828

②若 ,则 .

  1. (1) 将学习时间不少于6小时和少于6小时的学生数填入下面的 列联表:

    不少于6小时

    少于6小时

    总计

    甲班

    乙班

    总计

    能以95%的把握认为学习时间不少于6小时与班级有关吗?为什么?

  2. (2) 此次问卷调查甲班学生的学习时间大致满足 ,其中 等于甲班学生学习时间的平均数,求甲班学生学习时间在区间 的概率.
邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城5家商场的某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价 元和销售量 件之间的一组数据如下表所示:

价格

8.5

9

11

11.5

销售量

12

6

7

5

已知销售量 与价格 之间有较强的线性相关关系,其线性回归方程是 ,且 ,则其中的 .

下列命题为真命题的是(   )
A . 若数据 , …,的方差为3,则数据的方差为5; B . 对具有线性相关关系的变量x,y,其线性回归方程为 , 若样本点的中心为 , 则实数m的值是4; C . 若随机变量X服从正态分布 , 则 D . 若随机变量X服从二项分布 , 则
芯片作为在集成电路上的载体,广泛应用在手机、军工、航天等多个领域,是能够影响一个国家现代工业的重要因素.根据市场调研与统计,某公司七年时间里在芯片技术上的研发投入x(亿元)与收益y(亿元)的数据统计如下:

附:其回归方程的斜率和截距的最小二乘法估计分别为 . 参考数据

  1. (1) 根据折线图的数据,求y关于x的线性回归方程(系数精确到整数部分);
  2. (2) 为鼓励科技创新,当研发技术投入不少于16亿元时,国家给予公司补贴5亿元,预测当芯片的研发投入为17亿元时公司的实际收益.
新能源汽车的核心部件是动力电池,电池成本占了新能源整车成本很大的比例,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格一路水涨船高,下表是2021年我国江西某企业的前5个月碳酸锂价格与月份的统计数据:

月份代码

1

2

3

4

5

碳酸锂价格(万元/kg)

0.5

0.6

1

1.4

1.5

由上表可知其线性回归方程为 , 则(   )

A . 0.16 B . 0.18 C . 0.30 D . 0.32
最近更新