5.3.3 聚类分析 知识点题库

王老师想了解全班同学的成绩变化情况,较好的成绩分析方法是(   )
A . 将每位同学每次考试的成绩记录在纸张上然后进行分析 B . 将每位同学的每次考试成绩记录在Excel工作表中,然后利用图表进行分析 C . 每位同学自己统计分析自己的成绩,然后汇报给王老师 D . 将每次考试成绩张贴出来,进行直观比较
根据研究性学习小组活动的安排,刘晖要到森林公园收集野生动物的生存状况等资料,并制作一份演示文稿作品,他应该选择(   )信息工具最恰当      
A . PowerPoint B . Photoshop C . Excel D . Word
瑞中2015级主持人大赛决赛成绩如下,请根据各小题要求填空。

图一

  1. (1) “评委五”一列出现“#”提示符的原因:
  2. (2) 请使用min()函数完成“最低分”的统计,H3公式是:
  3. (3) 请完成五个评委的“原始总分”统计,I3公式是:
  4. (4) 请完成“最后总分”统计,J3公式是:

    ( 最后总分 = 原始总分 - 最高分 - 最低分)

  5. (5) 请完成“最后总分”的“总平均分”的统计,J17公式是:
  6. (6) 完成“最后总分”与“总平均分”差距(相减)的统计,K3公式是:
  7. (7) 如果以“最后总分”为关键字进行排序,应选择的区域为:
Excel中“求平均数”的函数是(  )
A . Min( ) B . Sum( ) C . Average( ) D . Max( )
某班主任收集了本班级学生线上学习情况的数据, 并用Excel软件进行数据处理,如第13题图a所示。请回答下列问题:

  1. (1) 通过H3单元格中的公式,对数据区域H4:H12进行自动填充,则H3单元格中的公式是

    (提示:COUNT IF函数用于计算某个区域中满足给定条件的单元格数目。例如:=COUNT IF(B2:B279“语文”)表示B2:B279区域中课程名称是“语文”的单元格数目)

  2. (2) 根据图a中数据制作的图表如图b所示,创建图表的数据区域是

  3. (3) 在区域A2:D280内找出“技术”课程中“认真度”最低的学生(若存在符合条件的多个记录,则全部选取)。下列方法可行的是     (多选,填字母)。
    A . 以“课程名称”为“技术”、“认真度”为“最小1项”进行筛选,然后选取筛选出的全部记录 B . 以“课程名称”为“技术”进行筛选,再以“认真度”为关键字升序排序,选取排在前面的记录 C . 以“课程名称”为主要关键字、“认真度”为次要关键字,均按升序排序,选取排在前面的记录 D . 以“认真度”为关键字升序排序,再以“课程名称”为“技术”进行筛选,选取排在前面的记录
小张同学收集了某地区近五年(2015-2019)供水用水情况数据,用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 小张在C10单元格输入公式后,又将C10单元格复制到C12,并用自动填充功能完成C10:G10,D12:G12单元格的数据计算,则C12单元格中显示的结果是(单选,填字母:A .#VALUE!/B .1266.27/C .#DIV/O!/D .14.32)
  2. (2) 若要按照上述方法正确计算所有“占总用水量百分比(%)”,小张应修改C10单元格的公式为
  3. (3) 根据图a数据,小张制作了一张反映近五年用水总量对比图,如图b所示,则该图表的数据区域为B3:G3,B9:G9,B11:G11,

  4. (4) 分析图表,近5年用水量变化波动最大的是(选填:农业用水/工业用水/生活用水/生态用水)
如图1是某校信息技术成绩概况表,分析回答下列问题:

图1

  1. (1) 如图1所示,区域C3:C14是通过公式计算得到的,要实现计算,可以选择区域中的C3单元格,输入公式,然后利用自动填充功能完成其他单元格的计算。

    (提示:合格数=实考数*(1-不及格率))

  2. (2) 若要将表格中的数据对班级按“优秀率”进行从高到低的排序,应选择的排序数据区域为
  3. (3) 若要用图表直观显示各班实考人数占全校实考人数的占比情况,应选择的数据区域是
  4. (4) 根据图1中数据制作的图表如图2所示,在下列操作中,能引起图表发生变化的是(多选,填序号:A . 以“平均分”为关键字对表格数据进行排序;B . 选定区域D3:D14设置单元格格式,保留2位小数;C . 把单元格D6的数据手工修改为73.4;D . 通过函数计算出全校平均分,填在单元格D15 )。

    图2

下面关于关联分析的基本算法错误的是(    )
A . 扫描历史数据,并对每项数据进行频率次数统计。 B . 构建候选项集C1,并计算其支持度,即数据出现频率次数与总数的比。 C . 对候选项集的支持度进行筛选,筛选的数据项支持度应当小于最小支持度, 从而形成频繁项集L1。 D . 对频繁项集L2进行连接生成候选项集C2,重复上述步骤,最终形成频繁K项集或 者最大频繁项集。
下列关于聚类分析的说法,错误的是(       )。
A . 可以从数据点集合中随机选择K个点作为初始的聚集中心 B . 对其他的每个数据点,以此判断其与K个中心点的距离,距离最近的表明它属于这项聚类 C . 聚类分析,必须先设定分类的标准,否则无法准确分类 D . 重新计算新的聚簇集合的平均值既中心点
大数据的分析理念在数据规模上强调相对数据而不是绝对数据。
聚类分析的基本算法从数据点集合中固定选择K个点作为初始的聚集中心,每个中心点代表着每个聚集中心的平均值。
下列不是用于有关关系分析的是(      )
A . 百分比圆环图 B . 雷达图 C . 词云图 D . 网络关系图
小王收集了部分理财产品和银行定期存款的利率数据,如图a所示。请回答下列问题:

  1. (1) D3:E10区域单元格格式设置如图b所示,计算年化收益率,可在E3单元格输入公式“=D *12”, 再通过自动填充完成区域E4:E10的计算,则E5单元格和E10单元格中显示的结果分别是(单选,填字母:A .18和0 /B .18.00 和 0.00 /C .18.00和#REF!/D .18.00和#VALUE!)

  2. (2) 对图a中的前5家银行按照月利率进行降序排序,应选择的数据区域是
  3. (3) 根据图a中的数据制作如图c所示的图表,下列说法正确的是           (多选)。

       

    A . 制作该图表的数据区域为C2:D2,C5:D9 B . 为了使图表中的数据对比更加明显,应对图表的坐标Y轴“最大值”和“主要刻度单位”做修改 C . 为了使图表柱形上方显示具体的数字,应设置数据标签选项 D . 对图a中区域B2:E10的“名称”和“月利率%”进行筛选,筛选方式分别如图d和图e所示,则图表中只显示1家银行的月利率数据
为了响应全民健身计划,某高中对学生进行了体质健康测评,并用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域M2:P15 的数据是通过公式计算得到的,在M2单元格中输入公式后,再使用自动填充功能完成该区域的计算,则N3单元格中的公式是“=SUMPRODUCT(()*($I$3:$I$553=N$1))”。

    (提示:M2单元格输入公式=SUMPRODUCT((A1:A100=“2”)*(I1:I100=“优秀”)),表示同时满足A1:A100是2班和I1:I100是优秀这两个条件的情况有几个,也就是进行条件计数。)

  2. (2) 根据图a中的数据制作的图表如图b所示。创建该图表的数据区域是

    图b

  3. (3) 对图a工作表进行相关数据分析,下列说法正确的是                    (多选,填字母)。
    A . 以“总分等级”为依据进行升序排序,选择的区域是A3:I553 B . 选择“A3:I553”按照“总分等级”升序排序后,图b的图表不会发生改变 C . 现需要选出总分等级为“不及格”的学生,可选择区域A3:I553,以“总分等级”为“不及格”进行筛选并保留结果 D . 为了显示男生立定跳远得分最高的3位学生数据,可先对“性别”为“男”进行筛选,再对“立定跳远”进行筛选,选择最大的3项
小王搜集了近5年各省(市)生产总值数据,并用Excel软件进行处理,如图a所示

  1. (1) 小王对收集的数据先进行了数据整理,以下关于数据整理说法错误的是         (单选,填字母)
    A . 对于数据缺失的问题,最简单的处理方法是忽略含有缺失值的实例或属性 B . 对于重复数据,可以在进一步审核的基础上进行合并或删除等处理 C . 逻辑错误的数据是指数据集中不符合一般规律的数据对象
  2. (2) 为计算图a中的“相对2016年的增长率(%)”,小王已经正确计算了单元格G4中的数据。他希望将单元格G4中的公式向下自动填充至单元格G34,再将区域G4:G34中的公式向右自动填充至J列,从而正确计算出区域G4:J34中的数据,则单元格G4中的公式应修改为
  3. (3) 利用图a数据制作的图表如图b所示,下列说法正确的是          (多选, 填字母)

    A . 制作该图表的数据区域为A2:A5,A12,F2:F5,F12 B . 图表创建后,无法更改图表的类型 C . 图表的柱形上方显示的具体数值,是通过设置图例实现的 D . 若修改F4单元格的数据,则图表中北京市对应柱形高度将发生变化
下图为某患者血液化验单,针对该化验单的分析不正确的是(    )

A . 红色框内的信息表明患者血红蛋白测定数据低于参考值 B . 该医院近年来的患者血液化验结果就可以构成医疗大数据 C . 蓝色框内是一组孤立的数据,不结合检查项目无法确定其含义 D . 医生根据化验结果做出诊断,依靠的是专业基础知识和临床实践经验
下列关于数据分析报告叙述正确是

①数据分析报告是项目研究结果的展示

②数据分析报告是数据分析结论的有效承载形式

③通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来

④数据分析报告不能为决策者提供科学、严谨的决策依据

小赵收集了近三年浙江省接待入境旅游者人数的数据,并使用Excel软件进行数据处理:

  1. (1) 在M4单元格中使用AVERAGEIF函数计算2017年亚洲所有国家的平均入境人数,然后通过自动填充得到M5:M7的公式,则M4单元格中的公式为(提示:AVERAGEIF函数用于对区域中满足条件的单元格求平均。例如:= AVER-AGEIF(A4: A18,J4, E4: E18)表示2016年所有亚洲国家的人境人数平均数)
  2. (2) 根据图a中数据制作的图表如图b所示,创建该图表的数据区域是:

  3. (3) 在图a所示的工作表中对数据作进一步操作,下列说法正确的是      (多选:填字母)
    A . 对表格数据区域A4:H18按“列A”为主要关键字升序排序,则图b中所示的图表不会发生变化。 B . 若要筛选出2016年欧洲入境旅游者人数同比增长最多的国家,可以选择A2:H18区域,以地区为“欧洲”、2016年“同比(%)”为最大1项进行筛选。 C . 若要筛选出2016 年欧洲人境旅游者人数同比增长最多的国家,可以选择A2:H18区域,以地区为“欧洲”进行筛选,再以2016年“同比(%)”为关键字进行降序排序,选取排在最前面的国家。 D . 在正确完成M4:M7计算后,小赵不小心将B列删除,则原M4:M7单元格中的数据不会发生变化。
小华收集了2011年~2020年全国废气主要污染物排放的部分数据,并使用Excel软件对数据进行处理,如图a所示。

请回答下列问题:

  1. (1) 在C4单元格中输入公式,再向下自动填充至单元格C12,并将区域C4:C12复制粘贴到区域E4:E12和G4:G12,则单元格E4中的公式为
  2. (2) 由于操作失误,不小心清除了单元格B12中的内容,则C12单元格中显示的结果是(单选,填字母A . #DIV/O! / B . #REF! / C . -100.00% / D . 100.00%)
  3. (3) 为了反映2011年~2020年全国废气主要污染物排放变化情况,根据图a中的数据制作的图表如图b所示。综合图a和图b,下列说法正确的有           (多选,填字母)。

    A . 创建该图表的数据区域为A1,A2:B12,D2:D12,F2:F12 B . 2011年~2020年间主要污染物排放量减少最快的是二氧化硫 C . 将图a中数据按年份进行降序排序,则图表不会发生变化 D . 将区域F3:F12中的数值格式设置为1位小数,则图表不会发生变化 E . 依次以“二氧化硫环比”、“氮氧化物环比”为筛选条件,都选择“最小3项”进行筛选后,筛选结果只显示2016年和2020年的数据
在数据处理中,除了可以对数值型数据进行分析外,还可以对文本、图像等数据进行分析。

最近更新