5.3.3 聚类分析 知识点题库

2008年的四川汶川地震造成了无可估量的损失,学校团委设立捐款处,直接收集同学们交来的捐款,并使用Excel记录捐款情况。捐款结束后,需要分类汇总各年级、各班的捐款总额,在汇总之前必须先进行的操作是(   )
A .   筛选 B . 求和 C . 合并计算 D . 排序
用Excel软件对教师招聘考试成绩进行统计,界面如图1所示,回答下列问题:
图1
  1. (1) 计算每个教师的“笔试成绩”,是用F4单元格公式填充到F5:F20区域得到,其中F20

    单元格中的公式为

  2. (2) 观察第图1,当前工作表进行了排序操作,排序的主要关键字和次要关键字依次是
  3. (3) 选中B3:F20单元格区域,按照图2所示对“笔试成绩”进行自定义筛选,筛选后将显示行数据。


    图2

请仔细观察下图,回答以下三个问题

  1. (1) 该工作簿文件名为:
  2. (2) 当前工作表名称为:
  3. (3) 制作如图所示的图表,应选择的数据区域是:

以下为2016年亚冠比赛部分球队的技术统计表,请根据表格提供的信息回答下面小题。

  1. (1) 分析数据表,该表F3单元格的公式应该为,若要把小数点后位数设置为2位,应该在下图格式设置进行设置。

  2. (2) 一同学选中I2:I12并如下图提示继续完成对球队的攻次数从高到低排序,请问排序完成后“排名”列的顺序会不会发生改变(填  会/不会);若按射正率进行排序应该选择的区域是

  3. (3) 下图图表的数据源区域为,若不小心把I3的数据改变了,请问图表中对应的柱形图会不会改变(填:会/不会)。

从下图中可知哪种学历段网民玩网络游戏的比例最低(  )。

A . 硕士及以上 B . 高中 C . 大学本科 D . 初中以下
小明收集了2020年6月3日的全球新冠肺炎疫情最新动态的数据,并将其中累计确诊人数超过5万的国家汇总成了一张表格,用Excel软件进行数据处理,如图a所示。

图 a

请回答下列问题:

  1. (1) 如图a所示,“排名”列的数据有Rank函数对“死亡率”列数据进行降序排名。小明通过H3单元格的公式对区域H4:H23进行自动填充,则H23单元格中显示结果是 (单选,填字母: A . # VALUE! / B . 17/ C . #DIV/0! / D . 1)。
  2. (2) 若要正确计算“排名”列的数据,可对H3单元格中的公式进行修改,对H4:H23进行自动填充,则H3单元格中的是
  3. (3) 小明在完成计算后,若要对欧洲地区的国家以“累计确诊人数”为关键字进行降序排序,则排序时选择的数据区域是
  4. (4) 根据图a中的数据制作的图表如图b所示,创建该图表的数据区域是

    图 b

在Excel中适合用于直观显示某校高二选课人数占比例的图表是(  )
A . 条形图 B . 柱形图 C . 折线图 D . 饼图
小王收集了学校教师欢乐四项赛得分的相关数据,并使用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 小王要通过自动填充将“报名号”的值填充为如图a所示的序列“01,02,……,18”,则可先将该区域单元格格式设置为(单选,填字母:A .数值/B .货币/C .百分比/D .文本)。
  2. (2) 在L5单元格中使用SUMIF函数计算高三年级所有选手总分之和,则L5单元格中的公式是

    (提示:SUMIF函数用于对以域中满足条件的单元格求和。例如:=SUMIF(B3:B20,"高二",I3:I20)表示高二年级所有选手总分之和)

  3. (3) 根据图a中数据制作的图表如图b所示,创建图表的数据区域是

    图b

  4. (4) 市教育工会将举行“巾帼杯”欢乐四项赛,比赛项目为上述四项,计分规则不变。比赛规则:每校由2名女教师参加;每项每校由1名教师参赛;每名教师参赛项目不限;比赛成绩为4项得分的总和。以本次教师欢乐四项赛的结果为依据,从林雅璇、郦佳玲和董雯静中选择2名选手代表学校参加比赛。为使学校取得最高总分,你的选择是(单选,填字母:A .林雅璇与郦佳玲/B .林雅璇与董雯静/C .郦佳玲与董雯静)。
某商场想捆绑销售商品,那么你对商场的建议是(   )
A . 采用聚类分析方法,从销售数据中找出最合适的商品进行捆绑销售 B . 采用关联分析方法,从销售数据中找出最合适的商品进行捆绑销售 C . 采用分类分析方法,从销售数据中找出最合适的商品进行捆绑销售 D . 采用分类模型方法,从销售数据中找出最合适的商品进行捆绑销售
数据特征探索的主要任务是(    )
A . 对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。 B . 分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。 C . 是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。 D . 是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
小王收集了“近三年某高校部分系的学生人数”的相关数据,并使用Excel软件进行数据处理,如图a所示。

图片_x0020_100004

图a

  1. (1) 区域 H3:J5中的数据是通过SUMIF函数计算得到的,在H3中输入公式再通过自动填充完成H列、I列、J列的相关区域的计算。(提示:SUMIF函数用于统计某个区域中满足条件的单元格数值之和。例如求2019年5个系的总人数:=SUMIF(A3:A17,G5,E3:E17))
  2. (2) 根据图a中的数据,制作了一张“2018年人数统计”的统计图表,如图b所示,图表的数据区域是

    图片_x0020_100005

    图b

  3. (3) 对图a中的数据进行统计分析,下列说法正确的是             (多选,填字母)
    A . 列E的数据是通过公式计算得到的,已知“E3”单元格的公式是“=C3+D3”,小李不小心把D3单元格的数据输成了“*”,这时E3单元格中将会显示为“#VALUE!” B . 选择“A2:E17”按照“总人数”降序排序后,图b的图表不会发生改变 C . 以“入学年份”等于“2018年”,“男生人数”最大1项进行筛选可以筛选到“2018年”中“男生人数”最多的记录 D . 以“入学年份”等于“2017年”,“系名”等于“?学?”可筛选出2017年“数学系”和“化学系”的记录
根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(    )。
A . 数据管理人员 B . 数据分析员  C . 研究科学家 D . 软件开发工程师
某同学收集某书店销售及库存的统计数据,使用EXCEL软件处理,如图a所示。

图a

每本书对应一个唯一的书名编码,请回答下列问题:

  1. (1) 根据“销售清单”每本书的销售数量,计算销售小计。先在H3单元格计算“书名编码”是“A”的销量小计,并将公式自动填充到H8单元格。则H3单元格的公式是

    (提示:SUMIF函数用于对区域中满足条件的单元格求和,例如:=SUMIF(B3:B9,B3,E3:E9),表示区域B3:B9中“书名”是“《量子力学》”的所有“小计”的和)

  2. (2) H8单元格显示的结果是(单选,填字母:A .#DIV/0! / B .#VALUE! / C .0 )。
  3. (3) 根据图a中数据制作的图表如图b所示,下列说法正确的是            (多选,填字母)。

    图b

    A . 创建该图表的数据区域是G5:H7 B . 将图a“销售清单”中第9行的书名编码“D”改为“A”,则图表会随之变化 C . 对图a“销售清单”中的数据区域A2:E9进行排序,则图表会随之变化 D . 删除“图a”工作表中书名编码是“A”所在的第3行,则图表不会随之变化
数据分析的基本方法包括特征探索、聚类分析、数据分类。
小王收集了2020年12月和2021年1月我国重要生产资料市场价格数据,并使用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域G3:G35的数据是通过公式计算得到的,在G3单元格中输入公式后,使用自动填充功能完成区域G4:G35的计算,则G3单元格中的公式是

    (提示:涨跌幅(%)=本期价格(元)-上期价格(元)/ 上期价格(元)*100)

  2. (2) 根据图a中的数据制作图表如图b所示,则图表的数据源是

    图b

  3. (3) 结合图a、图b分析,下列说法正确的有             (多选,填字母)。
    A . 若删除“F列”,则图b所示图表不会随之改变 B . 若不小心删除D3单元格的值,则G3单元格显示的内容变为“#DIV/0!” C . 以“类别”为“黑色金属”,“涨跌幅(%)”为“最大一项”进行筛选,则筛选出黑色金属中涨幅最大的产品 D . 选中区域A2:F35,按“比上期价格涨跌(元)”降序排序,区域G3:G35显示的值不会随之改变
德国男人超市购买婴儿纸尿布的同时往往还购买啤酒,计算机分析超市的购物数据后发现了这一规律,于是将啤酒货架移到了婴儿纸尿布货架旁,啤酒和纸尿布的销量都有所增加。计算机分析购物数据发现这一规律的过程属于
符合大数据概念的数据一般具有四个特征。大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
图为2020年2月3日-4月15日我国工程建设领域复工率(含新建项目)、复工强度变化的图标表达,下面说法正确的是(        )

A . ①②④⑤ B . ①②③ C . ③④⑤ D . ①④⑤
数据的可视化表达可以更直观生动地呈现数据及数据分析结果。下图是根据1949年至2019年台风大数据得出的图表,从中可以看到出71年以来西北太平洋和南海生成的秋台风和夏台风的概况,下列描述中错误的是(    )
A . 71年间,夏季和秋季分别生成台风824个和809个 B . 71年间,秋季台风登陆了175个,而夏季台风登陆了310个,相差将近一半 C . 秋台风在数量上与夏台风基本持平,但是平均而言每年登陆我国的秋台风比夏台风明显偏多 D . 71年间,秋台风和夏台风从数量上特别是登陆数量上进行PK,真台风取胜
下面是2006年中国足球超级联部分球队积分榜(截至第4轮),请进行如下分析。

球 队

积分

名次

上海联城

2

1

0

山东鲁能

3

0

1

大连实德

1

1

1

武汉光谷

2

1

1

北京现代

1

2

1

厦门蓝狮

1

2

1

长春亚泰

1

2

1

天津泰达

2

1

0

  1. (1) 请根据规则“比赛获胜积3分、打平积1分、落败积0分”计算各队积分,积分最多的球队是,最少的是
  2. (2) “北京现代”球队的排名是第。(相同积分的按相同名次算)例如a队20分;b队14分;c队10分;d队14分;这样的话,排名顺序就是a队第一,b\d两队都是第二,c 队第三。
  3. (3) 第五轮比赛结果是“上海联城1:0天津泰达”、“山东鲁能3:0长春亚泰”、“大连实德1:0厦门蓝狮”、“武汉光谷2:2北京现代”。

    请分析:第五轮过后,上升最快的是球队。

最近更新