5.3.3 聚类分析 知识点题库

“三八”国际妇女节,某单位要给本单位所有女工每人增加100元补贴,在修改“电子表格”相关数据时,比较好的做法(   )
A . 先筛选出全部女工,再逐条修改相关信息 B . 逐条检查记录,找到女工记录,逐条修改 C . 修改全部员工记录 D . 先筛选出全部女工,再统一替换相关信息
王老师想了解全班同学的成绩变化情况,比较容易的成绩分析方法是(   )
A . 将每次考试成绩张贴出来,进行直观比较 B . 将每位同学的每次考试成绩记录在笔记本上然后进行分析 C . 将每位同学的每次考试成绩记录在Execl中,然后利用图表进行分析 D . 每位同学自己统计分析自己的成绩,然后汇报给王老师
下图是某国各类能源消费量各年份的变化趋势情况分析表,从图中可看出什么,请简要回答。

图片_x0020_20

小王收集了学校教师欢乐四项赛得分的相关数据,并使用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 小王要通过自动填充将“报名号”列的值填充为如图a所示的序列“01,02,……,18”,则可先将该区域单元格格式设置为(单选,填字母:A .数值/B .货币/C .百分比/D .文本)。
  2. (2) 在L5单元格中使用SUMIF函数计算高三年级所有选手总分之和,则L5单元格中的公式是:

    (提示:SUMIF函数用于对区域中满足条件的单元格求和。例如:=SUMIF(B3:B20,“高二”,I3:I20)表示高二年级所有选手总分之和)

  3. (3) 根据图a中数据制作的图表如图b所示,创建图表的数据区域是

    图b

  4. (4) 市教育工会将举行“巾帼杯”欢乐四项赛,比赛项目为上述四项,计分规则不变。比赛规则:每校由2名女教师参加;每项每校由1名教师参赛;每名教师参赛项目不限;比赛成绩为4项得分的总和。以本次教师欢乐四项赛的结果为依据,从林雅旋、郦佳玲和董静雯中选择2名选手代表学校参加比赛。为使学校取得最高分,你的选择是(单选,填字母:A .林雅旋和郦佳玲/B .林雅旋和董静雯/C .郦佳玲和董静雯)
小董收集了某购书网站主要畅销书销售数据,并使用Excel软件进行数据处理,如下图表格所示。

  1. (1) 区域I3:I17的数据是通过公式计算得到的,在I3单元格中输入公式,再利用自动填充功能完成区域I4:I17的计算。
  2. (2) 根据上图表格中的数据制作了如下柱形图图表,创建该图表的数据区域是

  3. (3) 小董若在上图表格工作表中对数据进行进一步的操作,下列说法正确的是_____________(多选,填字母)。
    A . 若要对“历史人文”类别的书籍以“折扣”为关键字升序排序,应选择排序的区域是A6:I9 B . 若在该工作表中,对D3单元格的数值小数位数设置为1,I3单元格的数值不变 C . 若在该工作表中的C列和D列之间插入一列,则书籍《大国战略》的“年销售金额”数据将在单元格J17中,该单元格公式变为:=C17*$E17*SUM(F17:I17) D . 若以“定价(元)”为最小1项进行筛选,则上面柱形图图表不会变化
数据分类说法正确的是(    )
A . 对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。 B . 分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。 C . 是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。 D . 是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
数据分析可以分为(    )
A . 验证性分析 B . 深度分析 C . 描述性分析 D . 探索性分析
数据分析的方法不包括(     )。
A . 线性分析 B . 关联分析 C . 聚类分析 D . 数据分类
数据特征探索的主要任务是对数据进行预处理,以下不属于该过程的是(    )。
A . 数据清洗 B . 异常数据处理 C . 数据缺失处理 D . 数据分类处理
词云可以使得难以实现结构化的数据文本挖掘成为轻而易举的事情。
小王收集了2021大年初一到初七的电影票房数据,并用Excel软件进行数据处理,如图所示。

图a

请回答以下问题:

  1. (1) 区域J3:J12的数据是通过公式计算得到的,在J3单元格输入公式  ,再使用自动填充功能完成区域J4:J12的计算。

    (提示:票房占比=单部电影总票房/一周总票房*100)

  2. (2) 表中有具体名称的9部电影已经按2月12日票房降序排序,则排序时应该选择的数据区域是
  3. (3) 复制图a中A2:J11的数据到新工作表,对2月12日票房和总票房分别设置筛选条件为“最大4项”,则筛选出的结果有项。
  4. (4) 根据图a中的数据创建了如图b所示的图表,下列说法正确的是         (单选,填字母)

    图b

    A . 该图表使用了折线图,能较好体现变化趋势 B . 创建该图表的数据区域是A2:I8 C . 在图a的工作表中“电影名称”列前插入一列,图表会随之变化
某超市统计了特价商品的相关信息,用Excel软件对商品数据进行处理,如图a所示。

  1. (1) 要通过自动填充将“编号”列的值填充为如图a所示的序列“01,02,……,74”,则可先将该区域单元格格式设置为(单选,填字母:A .数值/B .货币/C .百分比/D .文本)。
  2. (2) 图a中区域H4:H75的折扣率是根据H3单元格自动填充得到,则H3单元格中的公式(折扣率=(零售价–特价)/零售价×100)
  3. (3) 对区域A2:H75进行相关数据分析,下列说法错误的是       (多选,填字母)。
    A . 删除了“单位”列,“折扣率%”列数据不会发生变化 B . 若要找出所有名称中含“茶”的饮料,可对“名称”列按图b条件进行筛选 C . 为找出“产地”为浙江,折扣率最大的商品,可以“产地”等于“浙江”为条件进行筛选,再对“折扣率%”进行筛选,选择“10个最大的值”,并显示为最大的1项 D . 为找出“产地”为广州,零售价格最高的商品,可以“零售价格”为关键字降序排序,再对“产地”进行筛选,条件为“广州”
在2021年7月23日到8月8日举行的“2020东京奥运会”上,共有206个国家、地区、独立代表团的11669名运动员参赛,争夺339枚金牌。奥运会闭幕后,小明从网上下载了金牌数前10名的国家,数据如图-1所示,然后根据各国金牌数绘制了柱形图,如图-2所示,请回答下面问题:

  1. (1) 在图-1中,表格标题“2020东京奥运会奖牌榜”所在的单元格是
  2. (2) 小明根据金牌数来计算各国名次,金牌数最多的为第1名,金牌数量相同名次也相同。小明采用“COUNTIF"函数在A3单元格计算美国队的名次,并自动填充到A4:A12单元格来计算其他国家的名次,则A3单元格应该输入(提示:“COUNTIF" 函数的功能是根据指定的条件来计数,例如=COUNTIF (F3:F12, ">"&F4)表示F3:F12范围内,统计比F4大的数的个数,结果是1。)
  3. (3) 根据图-1表格中的数据制作了图-2的图表,下列说法正确的是         (填字母)
    A . 绘制图-2图表时选择的数据区域是B3:C12 B . 将图-1表格中的数据以“奖牌总数”为关键字进行降序排列后,图-2的图表会发生变化 C . 若在图-1表格中“金牌”列前插入“参赛人数”列,图-2的图表会发生变化 D . 在图-2图表中的柱子上显示了金牌数据,这是通过“添加数据标签”实现的 E . 对图-1表格中。“国家/地区”列设置筛选条件为“包含国”,师选后,在图-2图表中看不到“日本”的情况(图表“隐藏和空单元格设置”默认
数据分析的过程不包括(     )。
A . 首先要根据分析的目标提出假设 B . 然后选择恰当的分析方法进行分析 C . 验证假设是否正确 D . 根据分析直接得出相应的结论
下列不是数据分析类型的是(     )。
A . 有关关系的分析 B . 有关比例的分析 C . 有关大小的分析 D . 有关趋势的分析
收集某校高一年级3个班趣味运动会相关数据,并用Excel软件进行数据处理,部分界面如图a所示。

请回答下列问题:

  1. (1) 区域H4:H123的数据是通过公式计算得到的,在H4单元格中输入公式

    再使用自动填充功能完成区域H5:H123的计算。(按照名次来计算得分,要求第1名得50分、第2名得49分……第50名得1分、其他名次得0分.提示:=IF(A4<8,8-A4, 0)表示A4单元格的值小于8时,返回8-A4的值,否则返回0)

  2. (2) 对区域A2:I123进行相关数据分析,下列说法正确的是           。(多选,填字母)
    A . 修改G4单元格的数据,I4单元格的值会随之改变 B . 为了将总得分最高的男生数据显示在当前工作表第4行,可选择数据区域A4:I123,以“列B”为主要关键字按字母升序、“列I”为次要关键字按降序进行排序 C . 选手编号规则为: S+两位班级编号+两位班内学号。先按“列I”降序排序,再对“选手编号”进行筛选,条件为包含“01”,则显示在最前面的是高一(1)班总得分最高的学生数据 D . 选手编号规则为: S+两位班级编号+两位班内学号。为了显示高一(3) 班总得分最高的3位学生数据,可先对“选手编号”进行筛选,条件为开头是“S03”,再对“总得分”进行筛选,选择“10个最大的值”并显示最大的3项
  3. (3) 对图a中的数据进行相关统计,结果放在新工作表中,如图b所示。根据图b中的数据制作的图表如图c所示。创建该图表的数据区域是

导航软件提供了“未来出行”功能,用户可以设定未来出行时间,软件利用大数据分析,预估未来行程所需时长,为用户合理规划出行时间提供参考。这一功能凸显了大数据分析的哪一个核心作用?(  )
A . 了解事物的现状 B . 剖析事物的发展历程 C . 预测事物的未来走向 D . 数据价值化
数据分析的方法不包括(     )
A . 线性分析 B . 关联分析 C . 聚类分析 D . 数据分类
数据分析的常用方法有等。
某品牌公司统计商品年销售数据,并用Excel软件进行数据处理,部分数据如第13题图a所示。请回答下列问题:

  1. (1) 图a中H2:K2单元格计算各销售渠道销售总额在2021年度总销售额中的占比,I2:K2的值是通过H2单元格自动填充得到,则H2单元格公式为

    (提示:各销售渠道销售总额在2021年度总销售额中的占比=各销售渠道销售总额/2021年度总销售额* 100)

  2. (2) 根据图a中的数据,制作了一张部分销售渠道2021年销售额走势图表,如图b所示,则制作该图表的数据区域是

  3. (3) 下列有关对图表和数据表操作描述,正确的是            (多选)。
    A . 将H2:K2区域设置单元格数字格式保留3位小数,会影响第13题图b所示图表效果 B . 为增加统计数据,在“月份”列后插入一列新数据,不影响原区域H2:K2所对应的新区域中的值 C . 要对2021全年12个月数据按“品牌官网”销售额排序,可以仅选择B2:B14 区域进行排序 D . 要筛选出电商平台和抖音直播间销售额均排在最高前三位的月份,可同时设置“电商平台”和“抖音直播间”列筛选条件为“最大的3项”得到
最近更新