数据分析 知识点题库

2008年的四川汶川地震造成了无可估量的损失,学校团委设立捐款处,直接收集同学们交来的捐款,并使用Excel记录捐款情况。捐款结束后,需要分类汇总各年级、各班的捐款总额,在汇总之前必须先进行的操作是(   )
A .   筛选 B . 求和 C . 合并计算 D . 排序
描述全校男女同学的比例关系,最好使用(   )
A . 柱形图 B . 条形图 C . 折线图 D . 饼图
有一张2013年与2014年浙江对主要市场进出口情况统计表,放置于Excel工作簿”sheet1”工作表中,如下图所示:

  1. (1) 计算各国家或地区的“出口额增幅”时(出口增幅(%)=(2014出口额(亿美元)- 2013出口额(亿美元))/2013出口额(亿美元)*100),先在F3单元格中输入公式,然后利用自动填充功能完成其余单元格的计算。结果如下图所示:

  2. (2) 若按各国家或地区的出口额增幅对表中数据区域A2:F10进行降序排序,则在下图所示的“排序”对话框中,“主要关键字”应为

  3. (3) 下图是以  区域的数据制作的2013年与2014年浙江对主要市场进口额比较图,该图表的类型是 (填:柱形图/条形图/折线图/饼图)。
小王收集了2014-2016年主要国家的外币储备数据,并用Excel软件进行处理,如图a所示。请回答下列问题:

  1. (1) 为计算2016年外币储备的排名情况,在F4单元格中使用RANK函数统计区域E4:E13中的排名,然后通过自动填充得到F5:F13的公式。请写出F4单元格中正确的公式:

    (提示:RANK函数功能为返回某数字相对于某一列数据的大小排名。该函数有三个参数,例如:=RANK(B4,B$4:B$20,0)表示B4在数据区域B4:B20中的排名,第三个参数0表示降序排列)

  2. (2) 根据图a中的数据制作如图b所示的图表,则该图表的数据区域为

  3. (3) 如图a所示,如果以“涨跌幅”为主要关键字进行排序,则排序时所选择的数据区域为
  4. (4) 将区域A3:F13的数据复制到新工作表,在新工作表中对数据进行筛选操作,筛选设置如图c所示,则按此设置筛选出的国家有个。

图a为某Excel工作表部分数据截图,请回答下列问题:

图a

  1. (1) 小王要通过自动填充将“学号”列的值填充为如图a所示的序列“O80101,080102,……,080128”,则可先将该区域单元格设置为(单选,填字母:A .数值/B .货币/C .百分比/D .文本)。
  2. (2) X10单元格是通过X4单元格自动填充完成,则可知X4单元格的公式为
  3. (3) 若要对图a数据按照物理选考最终成绩进行降序排序,应选择的数据区域是
  4. (4) 根据图a中的部分数据制作的柱形图如图b所示,创建该图表的数据区域为

    图b

为了直观地关注全国范围内新型冠状肺炎病毒感染的情况, 某同学使用Excel软件记录了2月4日至2月10日全国各省每天的累计确诊人数和治愈人数。部分界面如图1所示:

请回答下列问题:

  1. (1) 为了统计当天增加的确诊人数和治愈人数,该同学在039单元格使用公式已计算出2月10日的治愈增长人数,若在当前状态下使用自动填充的方式获得B39:N39单元格内的数据,C39单元格中的内容将为(单选,填选项:A .885/B .#REF!/C .#VALUE!/D .0)
  2. (2) 治愈率即当天的累计治愈人数占累计确诊人数的比重(治愈率=治愈/确诊*100%),为了计算截至2月10日的治愈率,应在N40单元格填写公式
  3. (3) 图2为部分省份某日疫情柱状图,绘制该图表的数据区域为:
  4. (4) 累计确诊人数超过1000人的地区为重点关注地区,为了了解国内有多少省份需要重点关注,可以使用“筛选”中的 (单选,填选项:A .最大10项/B .自定义筛选)获得。
某中学高一进行了一次学科能力测试,并将学生成绩用Excel软件进行数据处理,部分界面如图a所示。

请回答下列问题:

  1. (1) 表中每位学生的每门学科均差值=该同学该科成绩-该科平均成绩,因此需在E3单元格中输入公式,然后自动填充到E4:E22,并复制粘贴到G3:G22,H3:H22各区域,完成每位学生的每门学科均差值的计算。
  2. (2) 由于操作失误,将区域J3:J22的数据误删除,则J23 单元格中显示的结果是。(单选,填字母 A .0.0 / B .#DIV/0! / C .#REF! / D .234.1)
  3. (3) 根据图a所示的数据制作了图表如图b所示,下列描述正确的是             (多选题,填字母)
    A . 该图表的数据区域为D2,F2,H2,C23:D23,F23,H23 B . 将A2:J22区域的数据按总分进行降序排序,则图表不会发生变化 C . 以“班级”为高一(2)班、“总分”为最大1项进行筛选,则可以筛选出高一(2)班总分最高的学生 D . 先以“班级”为高一(2)班进行筛选,然后再按照总分进行降序排序,则最前面一条记录为高一(2)班总分最高的学生
网上购物过程中,经常会看到“看了此商品的会员通常还看了…”、“买了此商品的会员通常还买了…”。这些信息既方便了顾客购物选择,又为商家赢得了更多的利润。这里采用的技术是(   )
A . 联机分析处理 B . 智能代理 C . 智能机器人 D . 数据挖掘
某商场想捆绑销售商品,那么你对商场的建议是(   )
A . 采用聚类分析方法,从销售数据中找出最合适的商品进行捆绑销售 B . 采用关联分析方法,从销售数据中找出最合适的商品进行捆绑销售 C . 采用分类分析方法,从销售数据中找出最合适的商品进行捆绑销售 D . 采用分类模型方法,从销售数据中找出最合适的商品进行捆绑销售
小王收集了“近三年某高校部分系的学生人数”的相关数据,并使用Excel软件进行数据处理,如图a所示。

图片_x0020_100004

图a

  1. (1) 区域 H3:J5中的数据是通过SUMIF函数计算得到的,在H3中输入公式再通过自动填充完成H列、I列、J列的相关区域的计算。(提示:SUMIF函数用于统计某个区域中满足条件的单元格数值之和。例如求2019年5个系的总人数:=SUMIF(A3:A17,G5,E3:E17))
  2. (2) 根据图a中的数据,制作了一张“2018年人数统计”的统计图表,如图b所示,图表的数据区域是

    图片_x0020_100005

    图b

  3. (3) 对图a中的数据进行统计分析,下列说法正确的是             (多选,填字母)
    A . 列E的数据是通过公式计算得到的,已知“E3”单元格的公式是“=C3+D3”,小李不小心把D3单元格的数据输成了“*”,这时E3单元格中将会显示为“#VALUE!” B . 选择“A2:E17”按照“总人数”降序排序后,图b的图表不会发生改变 C . 以“入学年份”等于“2018年”,“男生人数”最大1项进行筛选可以筛选到“2018年”中“男生人数”最多的记录 D . 以“入学年份”等于“2017年”,“系名”等于“?学?”可筛选出2017年“数学系”和“化学系”的记录
某组织将关于春节期间人们主要支出的调查数据进行可视化分析,其结果如图所示,下列分析错误的是(    )

A . 不同年龄段的人群“买年货”的支出都比较多 B . 在“娱乐活动”的支出中,23~30岁人群的花费最多 C . 60岁以上人群支出最多的是“压岁钱”,支出最少的是“交通费” D . 在“走亲访友的礼物”支出中,51岁以上人群的花费比较多
K-平均算法属于(     )分析方法。
A . 线性 B . 关联 C . 聚类 D . 聚类  
如下图,根据表中数据,下列描述正确的是(   )

图片_x0020_100032

A . 机构数一直都在增长 B . 从业人员数一直都在增长 C . 2019年演出收入比2018年高 D . 2019年国内演出观众人次最高
数据挖掘时指在庞大的数据库中寻找有价值的隐藏实践,加以分析,并将有意义的信息进行归纳,为决策提供参考依据和控制机制,因此,(      )是信息挖掘的第一步。
A . 数据清理 B . 数据收集 C . 数据变换 D . 数据归纳
小王搜集了近5年各省(市)生产总值数据,并用Excel软件进行处理,如图a所示

  1. (1) 小王对收集的数据先进行了数据整理,以下关于数据整理说法错误的是         (单选,填字母)
    A . 对于数据缺失的问题,最简单的处理方法是忽略含有缺失值的实例或属性 B . 对于重复数据,可以在进一步审核的基础上进行合并或删除等处理 C . 逻辑错误的数据是指数据集中不符合一般规律的数据对象
  2. (2) 为计算图a中的“相对2016年的增长率(%)”,小王已经正确计算了单元格G4中的数据。他希望将单元格G4中的公式向下自动填充至单元格G34,再将区域G4:G34中的公式向右自动填充至J列,从而正确计算出区域G4:J34中的数据,则单元格G4中的公式应修改为
  3. (3) 利用图a数据制作的图表如图b所示,下列说法正确的是          (多选, 填字母)

    A . 制作该图表的数据区域为A2:A5,A12,F2:F5,F12 B . 图表创建后,无法更改图表的类型 C . 图表的柱形上方显示的具体数值,是通过设置图例实现的 D . 若修改F4单元格的数据,则图表中北京市对应柱形高度将发生变化
收集某地农产品市场价格表,并用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 区域H4:H30的数据是通过公式计算得到的,在H4单元格中输入公式,再使用自动填充功能完成区域H5:H30的计算。
  2. (2) 对区域A3:I30进行相关数据分析,下列说法正确的是           (多选,填字母)。
    A . 更新F列数据,H列数据会随之改变 B . C6单元格与D6单元格内的实际数值可能不相同 C . 为了找出农产品市场平均价中价格最高的肉蛋类,可先对“类别”进行筛选,选择值为“肉蛋类”,再对“农产品市场平均价”进行降序排序,选取排在最前面的肉蛋类 D . 为了将农产品市场平均价中价格最高的肉蛋类显示在当前工作表第4行,可选择类别为主要关键字,农产品市场平均价为次要关键字均按降序排序 E . 为了显示农产品市场平均价中价格最高的3种蔬菜,可先对“类别”进行筛选,选择值为“蔬菜类”,再对“农产品市场平均价”进行筛选,选择“10个最大的值”并显示最大的3项
  3. (3) 对图a中数据进行相关统计,结果放在新工作表中,如图b所示。根据图b中的数据制作的图表如图c所示。创建该图表的数据区域是,E7:G11。

某男同学的体重80KG,身高170cm,请问,以下能用来判断该同学偏肥或偏瘦最有效的数据分析方法是
下列关于数据分析报告叙述正确是

①数据分析报告是项目研究结果的展示

②数据分析报告是数据分析结论的有效承载形式

③通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来

④数据分析报告不能为决策者提供科学、严谨的决策依据

小清收集了2016~2020年我国电力、燃料及水消耗量的部分数据,并使用Excel软件对数据进行处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域E4:E8的数据是通过公式计算得到的,在E4单元格中输入公式,再使用自动填充功能完成区域E5:E8的计算。 
  2. (2) 利用“设置单元格格式”将E列数值设置保留1位小数后,以“住户用电量占年总耗电量比%”为主要关键字,以“住户”为次要关键字,将A4:J8单元格区域内数据进行降序排序,则2019年数据所在行标值为。 
  3. (3) 为了反映2016~2020年我国水消耗量变化情况,根据图a中的数据创作的图表如图b所示。综合图a和图b,下列说法正确的有(   )(多选,填字母)。

    图b

    A . 创建该图表的数据区域为A2:A8,J2:J8 B . 2016~2019年间水消耗量逐年递增,2020年出现下降情况 C . 要分别筛选出五年内“汽油”和“液化石油气”消耗量最高年份,可同时对H、I列设置筛选条件“最大的一项” D . 交换C列和D列的数据位置,会影响E列数据值的计算
小明上网查询了浙江省新冠疫情各个地级市的相关数据(截止4月28日16时),并制成了Excel表格,界面如图a所示,请回答下列问题。

图a

  1. (1) J4:J14区域的数据是通过J3的单元格进行自动填充得到的,则J3单元格的公式是 (累计确诊百分比=当前市累计确诊/总计累计确诊*100)

    图b

  2. (2) 根据第图a中数据制作的图表如图b所示,创建该图表的区域是
  3. (3) 下列描述正确的是          
    A . 若单元格C3被误删,则J3单元格显示为#REF! B . 若要对数据按照“累计确诊”进行排序,排序区域为A2:J14 C . 将A2:J13复制到新的工作表中,以“累计确诊”最大3项筛选,再按“新增本土”最大3项筛选,结果筛选出2条记录 D . 在列A后插入一列,J列“累计确诊占全省的百分比(%)”相应数据不发生变化 E . 对区域A2:J13按照“现有确诊”排序后,图b会发生变化
最近更新