5.3 数据的分析 知识点题库

为了直观地关注全国范围内新型冠状肺炎病毒感染的情况, 某同学使用Excel软件记录了2月4日至2月10日全国各省每天的累计确诊人数和治愈人数。部分界面如图1所示:

请回答下列问题:

  1. (1) 为了统计当天增加的确诊人数和治愈人数,该同学在039单元格使用公式已计算出2月10日的治愈增长人数,若在当前状态下使用自动填充的方式获得B39:N39单元格内的数据,C39单元格中的内容将为(单选,填选项:A .885/B .#REF!/C .#VALUE!/D .0)
  2. (2) 治愈率即当天的累计治愈人数占累计确诊人数的比重(治愈率=治愈/确诊*100%),为了计算截至2月10日的治愈率,应在N40单元格填写公式
  3. (3) 图2为部分省份某日疫情柱状图,绘制该图表的数据区域为:
  4. (4) 累计确诊人数超过1000人的地区为重点关注地区,为了了解国内有多少省份需要重点关注,可以使用“筛选”中的 (单选,填选项:A .最大10项/B .自定义筛选)获得。
小张同学收集了某地区近五年(2015-2019)供水用水情况数据,用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 小张在C10单元格输入公式后,又将C10单元格复制到C12,并用自动填充功能完成C10:G10,D12:G12单元格的数据计算,则C12单元格中显示的结果是(单选,填字母:A .#VALUE!/B .1266.27/C .#DIV/O!/D .14.32)
  2. (2) 若要按照上述方法正确计算所有“占总用水量百分比(%)”,小张应修改C10单元格的公式为
  3. (3) 根据图a数据,小张制作了一张反映近五年用水总量对比图,如图b所示,则该图表的数据区域为B3:G3,B9:G9,B11:G11,

  4. (4) 分析图表,近5年用水量变化波动最大的是(选填:农业用水/工业用水/生活用水/生态用水)
张老师请小红同学统计全班期末7门考试总分前10名的学生名单。小红做了以下工作①按学号顺序,建立了包含学号、姓名、各科成绩的Excel工作表。并输入了所有同学的各科成绩②在工作表中用相关函救计算出每位同学的总分,并存放在工作表的相应位置③选前10条记录④按总 分递减的顺序排序。这些工作的正确顺序是(  )。
A . ①②③④ B . ②①④③ C . ①②④③ D . ③①②④
小王收集了2018年、2019年、2020年内地电影票房排行数据,并使用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 如图a所示,区域A10:A18通过RANK函数计算得到2019年总票房的年度排名,在A10单元格输入公式后,用自动填充功能完成A11:A18的计算,则A10单元格的公式是

    (提示:RANK函数返回某数字在一串数值中的相对其他数值的大小排名。例如:=RANK(D3,D3:D9)表示D3中的数值在D3:D9区域中所有数值中的大小排名)

  2. (2) 根据图a中数据制作的图表如图b所示,创建该图表的数据区域是,C17,D17,C19,D19。
  3. (3) 如果给2020年的电影按“总票房(亿)”进行从高到低排序,应选择的数据区域为,排序完成后,图b所示的图表是否会发生改变(选填:会/不会)。
以下属于大数据应用实例的是(     )。

①某系统通过用户视频点播的基础数据如评分、播放、快进等,分析计算出用户可能喜爱的影片,并为他提供定制化的推荐

②某网站通过追踪用户在其网络的行为,识别用户在它的网络中的好友,从而给出新的好友推荐建议

③某交通流量数据公司依靠分析历史和实时路况数据,能给出及时的路况报告,以帮助司机避开正在堵车的路段,并且帮他们提前规划好行程

④某保险公司天都会对美国境内超过100万个地点、未来两年的天气情况进行超过1万次模拟,而后将根系结构和土壤孔隙度的相关数据,与模拟结果相结合,为成千上万的农民提供农作物保险

A . ①②④ B . ①②③ C . ②③④ D . ①②③④
某商场想捆绑销售商品,那么你对商场的建议是(   )
A . 采用聚类分析方法,从销售数据中找出最合适的商品进行捆绑销售 B . 采用关联分析方法,从销售数据中找出最合适的商品进行捆绑销售 C . 采用分类分析方法,从销售数据中找出最合适的商品进行捆绑销售 D . 采用分类模型方法,从销售数据中找出最合适的商品进行捆绑销售
数据聚类分析的主要任务是(    )
A . 对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。 B . 分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。 C . 是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。 D . 是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
使用Excel软件处理“2019年4月流通领域重要生产资料市场价格变动情况”数据,如图所示。

  1. (1) 计算表中下旬价格相比上期价格的涨跌幅(%):选择G4单元格输入公式,然后用自动填充功能完成其他单元格的计算则G4单元格中可使用的公式为
  2. (2) 若要对比分析图中的上、下旬价格的变化情况,写出一种分析方法。
某超市曾经研究销售数据,发现买商品A的人购买商品B的概率很大,这种属于数据的(      )。
A . 聚类分析 B . 关联分析 C . 分类分析 D . 回归分析
聚类分析的基本算法从数据点集合中固定选择K个点作为初始的聚集中心,每个中心点代表着每个聚集中心的平均值。
下列不是有关逻辑关系的分析是(     )
A . 散点图 B . 词云 C . 数据地图 D . 雷达图
王老师收集了学校男生寝室三项检查成绩的数据,并使用Excel软件对数据进行处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域L4:L93的数据是通过公式计算得到的,在L4单元格中输入公式,再使用自动填充功能完成区域L5:L93的计算。(提示:总分=内务分×20%+卫生分×30%+纪律分×50%)
  2. (2) 寝室号的编制规则是:楼号(第1字符)+楼层号(第2字符)+房间号(第3、4字符)。若要筛选出各男生寝室楼的3楼寝室,筛选方式设置如图b所示,则①处应为 (选填:包含/等于/开头是)。

    图b

  3. (3) 在新工作表中计算各年级“内务分”、“卫生分”和“纪律分”的平均分后,创建了如图c所示的图表。结合图a和图c,下列说法正确的有          (多选,填字母)。

    图c

    A . 由图c可知男生寝室纪律最好的是高三,内务和卫生最好的是高二 B . 更新数据导致高一“内务分”的平均分发生变化,图表不会随之改变 C . 对区域L2:L3执行“合并单元格”操作,合并后的单元格名称为L2 D . 在图a所示工作表的“寝室号”列前插入一列,“总分”列的数值会发生改变
如图b所示,可以看出成绩稳步上升的班级是(    )

A . 高一(1)班 B . 高一(2)班 C . 高一(3)班 D . 不能确定
平均分析和对比分析单个使用,更能清楚地反映要分析事物的不同情况特征。
数据分析的过程不包括(     )。
A . 首先要根据分析的目标提出假设 B . 然后选择恰当的分析方法进行分析 C . 验证假设是否正确 D . 根据分析直接得出相应的结论
收集某地农产品市场价格表,并用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 区域H4:H30的数据是通过公式计算得到的,在H4单元格中输入公式,再使用自动填充功能完成区域H5:H30的计算。
  2. (2) 对区域A3:I30进行相关数据分析,下列说法正确的是           (多选,填字母)。
    A . 更新F列数据,H列数据会随之改变 B . C6单元格与D6单元格内的实际数值可能不相同 C . 为了找出农产品市场平均价中价格最高的肉蛋类,可先对“类别”进行筛选,选择值为“肉蛋类”,再对“农产品市场平均价”进行降序排序,选取排在最前面的肉蛋类 D . 为了将农产品市场平均价中价格最高的肉蛋类显示在当前工作表第4行,可选择类别为主要关键字,农产品市场平均价为次要关键字均按降序排序 E . 为了显示农产品市场平均价中价格最高的3种蔬菜,可先对“类别”进行筛选,选择值为“蔬菜类”,再对“农产品市场平均价”进行筛选,选择“10个最大的值”并显示最大的3项
  3. (3) 对图a中数据进行相关统计,结果放在新工作表中,如图b所示。根据图b中的数据制作的图表如图c所示。创建该图表的数据区域是,E7:G11。

某店铺每周都要进行“店铺进销存统计分析”,如图1所示,请回答下列问题:

  1. (1) 为统计每天“销售额占本周销售总额百分比”情况,如图1所示,先计算出H4单元格中的值,再自动填充完成其它日期所占销售总额百分比的计算,则H4单元格的公式为:。(提示:销售额占本周销售总额百分比=销售额(元)/本周销售总额(元)×100)
  2. (2) 图1中表格已经执行过排序操作,排序方法:先选择为排序区域,再单击工具栏中“排序”按钮,并设置(填字段名)为主关键字降序排列。
  3. (3) 为了更直观表示相关数据差异,在经过排序后,该店铺员工为该表建立了柱形图表,如图2所示:

    分析该图表可知,该柱形图数据源范围是

  4. (4) 为了方便查询系统查询,该店铺员工根据图1的表格数据,利用Access软件创建了数据库文件,建立了“2015年6月第三周店铺进销存统计周数据”数据表,数据表内容如图3所示,他想修改第2条记录的“ID”值,却怎么都修改不了,原因是:

收集2020年全国部分城市1-4月降雨量,并用Excel软件对数据进行处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域G3:G36的数据要通过公式计算得到,在G3单元格中输入公式,再使用自动填充功能完成区域 G4:G36的计算。(rank函数的作用求某一个数值在某一区域内一组数值中的排名。rank函数的语法格式=rank(number,ref,[order])number ——参与排名的数值,ref ——排名的数值区域,order——有1和0两种。0——从大到小排名(降序),1——从小到大排名(升序)。0默认不用输入,得到的就是从大到小的排名。)
  2. (2) 对区域A2:G36进行相关数据分析,下列说法正确的是                (多选,填字母)
    A . 为了显示华北地区4月降雨量大于60的城市,可以先对“地区”进行筛选选择的值为“华北地区”,再对“4月”进行筛选,设置的筛选条件是大于60 B . 为了找出3月降雨量最高的三个城市,可以对“3月”进行筛选,选择“10个最大的值”并显示最大的3项 C . 若不小心删除C列数据,G列2月降雨量排名的值也会随之变化 D . 从数据表中可以看出,华北地区1月几乎不降雨
  3. (3) 要对2020年华东地区4月的降雨量为主要关键字降序排序 ,则所选择的数据区域是
下图为某患者血液化验单,针对该化验单的分析不正确的是(    )

A . 红色框内的信息表明患者血红蛋白测定数据低于参考值 B . 该医院近年来的患者血液化验结果就可以构成医疗大数据 C . 蓝色框内是一组孤立的数据,不结合检查项目无法确定其含义 D . 医生根据化验结果做出诊断,依靠的是专业基础知识和临床实践经验
某男同学的体重80KG,身高170cm,请问,以下能用来判断该同学偏肥或偏瘦最有效的数据分析方法是
最近更新