5.3.3 聚类分析 知识点题库

在Excel的单元格中输入下列内容后,显示结果为3的是(   )   
A . 9-6 B . "9/3" C . =9/3 D . ="1+2"
钱会计要统计公司各部门的工资总额,做了以下工作:

  ①按员工姓名顺序,建立了包含工号、姓名、部门、工资等字段的Excel工作表,并输入了所有员工的相关信息

  ②选定相关的数据区域

  ③通过数据“分类汇总”出各部门的工资总额

  ④按部门递减的顺序排序

这些工作的正确顺序是(   )

A . ①、②、③、④ B . ②、①、④、③ C . ①、②、④、③ D . ③、①、②、④
描述全校男女同学的比例关系,最好使用(   )
A . 柱形图 B . 条形图 C . 折线图 D . 饼图
主要用于数据的统计与分析的软件是(   )
A . MicrosoftExecl B . MicrosoftPowerPoint C . 记事本 D . MicrosoftWord
小张收集了某文化制造企业相关数据,并用Excel软件进行处理,如图a所示。

请回答下列问题:

  1. (1) 区域D6:D20的数据是从D5单元格利用自动填充功能得到的,则D11单元格的公式是
  2. (2) 在自动填充过程中,单元格D10将显示为。(单选,填字母:A .0/B .#DV/0!/C .#VALUE!/D .数据正常显示)
  3. (3) 小张根据图a数据建立如图b所示图表,其选择的数据区域是

  4. (4) 小张对图a中的数据进行筛选操作,筛选设置界面如图c所示,在下拉列表中选择选项后,单击“确定”按钮,图b将变成如图d所示。

小刘收集了“技术学科2017届,2018届选考成绩”相关数据,使用Excel处理,部分界面如图a所示。

图a

请回答以下问题:

  1. (1) 区域D4:D11的数据由单元格D4中的公式自动填充得到,为了保证修改各档人数后“单档比例”仍然正确,则D4单元格中输入的公式是
  2. (2) 若要将各档数据按“累计比例差”升序排序,排序时应选择的数据区域是
  3. (3) 小刘为了对比2017届、2018届各档比例,制作了如图b所示的图表。

    图b

    结合原始数据和图表,下列说法正确的是______(多选)。

    A . 将D4:D11中的公式复制并粘贴到H4开始区域,一定可以得到“2018届各档比例” B . 各档数据按“累计比例差”升序排序后,图表中数据先后位置也会变化 C . 将B4单元格的数值改为33,图中仅2017届“100人数”所对应的“柱形”变短 D . 选择“A4:A11,D4:D11,H4:H11”作为数据区域,并对标题、图例进行设置,可生成上述图表
张老师请小红同学统计全班期末7门考试总分前10名的学生名单。小红做了以下工作①按学号顺序,建立了包含学号、姓名、各科成绩的Excel工作表。并输入了所有同学的各科成绩②在工作表中用相关函救计算出每位同学的总分,并存放在工作表的相应位置③选前10条记录④按总 分递减的顺序排序。这些工作的正确顺序是(  )。
A . ①②③④ B . ②①④③ C . ①②④③ D . ③①②④
小王收集了“浙江省各地市2014、2015年人口统计表”的数据。并用excel软件进行分析,部分界面如

图a所示,请回答下列问题:

  1. (1) 区域 F3:G13 中的排名数据由 F3 单元格中使用 Rank 函数计算后进行自动填充获得,则应在 F3 单元格中 输入公式                。(Rank 函数是返回某数字在一列数字中相对于其他数值的大小排名的一个函数,如:Rank(A1,A1:A10)是计算A1在数据区域A1:A10中降序排序的名次)。

  2. (2) 根据图 a 中数据制作如图 b 所示的图表,则创建图表的数据区域是
  3. (3) 小王想要找出浙东北地域人口增长率最高的 3 地市,下列操作可行的是    
    A . 以“地域”等于“浙东北”进行筛选,再以“人口增长率(%)”为最大3项进行筛选,找到筛选出的地市。 B . 复制区域A2:G8到新的工作表,然后在新工作表中以“人口增长率(%)”为最大3项进行筛选,找到筛选出的地市。 C . 选取区域A2:G8,以“人口增长率排名”为关键字进行升序排序,找到排在前面的3个地市。 D . 选取区域B3:G8,以“列E”为关键字进行降序排序,找到排在前面的3个地市。
小方使用Excel分析某网店2018年第四季度销售的相关数据,部分界面如下图所示:

  1. (1) 表中本季总销量的计算是通过在L5单元格中输入公式,并将公式自动填充到L18单元格后得到的,请问,L8单元格中的公式是
  2. (2) 建立了一张反应本季单品总盈的柱型图,如下图所示:应选择的数据区域是,图表生成后,小方对本季单品总盈这列数据进行了 操作,已生成的图表(填“会”或“不会”)发生变化。

  3. (3) 对表中各产品的“进价(元)”和“12月销量”的数据进行筛选操作,筛选条件设置如下图所示,则按此设置筛选出的产品有个。

网上购物过程中,经常会看到“看了此商品的会员通常还看了…”、“买了此商品的会员通常还买了…”。这些信息既方便了顾客购物选择,又为商家赢得了更多的利润。这里采用的技术是(   )
A . 联机分析处理 B . 智能代理 C . 智能机器人 D . 数据挖掘
数据聚类分析的主要任务是(    )
A . 对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。 B . 分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。 C . 是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。 D . 是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
总结归纳数据分析的常用方法。
(      )和回归分析都可用于预测,预测是指从基于样本数据记录,根据分类准则自动给出对未知数据的推广描述,从而实现对未知数据进行预测。
A . 特征探索 B . 数据分类 C . 聚类分析 D . 关联分析
人事部统计了公司面试人员三项成绩的数据,并使用Excel软件对数据进行处理,请回答下列问题:
  1. (1) 区域L4:L100的数据是通过公式计算得到的,在L4单元格中输入公式后,再使用自动填充功能完成区域L5:L100的计算,则由图a可知 L100 单元格中的公式为。(提示:总分=笔试总分×50% +面试总分×30%+才艺总分×20%)

    图 a

  2. (2) 若要按照总分成绩对本次参加招聘的人员进行降序排序,则应选取的排序区域为
  3. (3) 在新工作表中计算各面试人员“笔试总分”、“面试总分”和“才艺总分”的平均分后,创建了如图b所示的图表。结合图a和图b,下列说法正确的有                 (多选,填字母)。

    图 b

    A . 由图b可知男生面试总分平均分远高于女生,而女生的笔试及才艺平均分高于男生 B . 由图a可知,列A中的单元格格式可能为数值类型 C . 在图a所示工作表的L列前插入一列,“总分”列的数值会发生改变 D . 更新数据导致新工作表中男生“笔试总分”的平均分发生变化,图表会随之改变
关于新冠肺炎疫情的信息,由疫情实时大数据报告(如图为部分数据截图)获知,其中用汉字、数值、加减符号描述疫情确诊、治愈、死亡等情况;还可以用颜色、数据表、图描述疫情地区分布、境外输入确诊趋势等情况。请运用数据信息、知识与智慧之间的相互关系完成下列判断。

  1. (1) 疫情实时数据记录的形式有汉字、颜色、图等,因此数据具有二进制性特征。
  2. (2) 图1中用深红色突出显示确诊人数在10000以上的地区,深红色是数据,也是载体,它所承载的信息是“新冠肺炎确诊人数≥10000”。
  3. (3) 由图2可获知“新型冠状病毒肺炎国外新增确诊人数呈上升趋势”。
  4. (4) 由图1中“数据更新至2020.10.21 15:26”表明信息具有时效性,一旦超过其“生命周期”就失去原有的效用,成为历史记录。
  5. (5) 从图中获取新冠疫情数据和信息,不仅能帮助我们了解疫情情况,还能帮助我们解决个人防护问题。
  6. (6) 知悉新冠肺炎具有传染性后,我们需要学习新冠肺炎预防知识进行个人防护。
德国男人去超市购买婴儿纸尿布时,其中不少人还购买啤酒。计算机分析超市的购物数据后发现了这一现象,于是将啤酒和婴儿纸尿布放一起,啤酒和纸尿布的销量都有所增加。计算机分析购物数据发现这一现象的过程属于(     )。
A . 信息分类 B . 智能代理 C . 模式识别 D . 数据挖掘
使用Excel软件对某学校“校园文化节”节目评分进行数据处理,如图所示,回答下列问题: 

  1. (1)  各大节目的得分是将“主题内容”、“舞台效果”、“表现演绎”、“总体印象”的成绩分别乘以对应的权重后相加所得。通过 G3 单元格中的公式,对 G4:G20 进行自动填充,则G3单元格中的公式是。 
  2. (2) 为了要对比分析图中歌唱类各节目(主题内容、舞台效果、表现演绎、总体印象)的得分情况,请写出一种分析方法:
    A.哪些数据是本次分析必需的,写出数据区域。  B.如何分析这些数据,选用哪种图表类型
  3. (3) 若要对图中舞蹈类按得分进行降序排序,需选择的排序区域是
使用Excel软件处理某超市进销存数据,如图a所示。

请回答下列问题:

  1. (1) 区域H3:H357的数据通过公式计算得到:在H3单元格中输入公式,再使用自动填充功能完成区域H4:H357的计算。(提示:利润=(商品售价-商品进价)×销量)
  2. (2) 图a中“粮油类”商品编码数据“101717”误输入为“10177”,“粮油类”商品按“商品编码”升序排序后,发现“10177”位于“101720”之后,其原因是B355、B356单元格中的数据是类型。
  3. (3) 完成图a中的各类商品总利润计算之后,制作了如图b所示的图表。下列说法正确的有              

    A . 总利润最高的商品是水果类 B . 对区域E3:G357数据格式设置为“保留1位小数”,“利润”列数据保持不变 C . 在图a所示工作表中按“商品名称”筛选所有花生油,图c中①处可选择“包含” D . 对蔬菜类以“销量”为关键字进行升序排序,则选择的排序数据区域为A2:H130
数据分析的流程包括:①数据可视化;②数据预处理;③数据收集;④问题定义;⑤数据分析与建模。下列选项排序正确的是(  )
A . ④②③①⑤ B . ③④②⑤① C . ④③②⑤① D . ③④⑤①②
下列关于中文分词方法的描述中,属于基于统计的分词方法的是(     )
A . 在分析句子时与词典中的词语进行对比,词典中出现的就划分为词 B . 依据上下文中相邻字出现的频率统计,同时出现的次数越高就越可能组成一个词 C . 让计算机模拟人的理解方式,根据大量的现有资料和规则进行学习,然后分词 D . 依据词语与词语之间的空格进行分词
最近更新