5.3.3 聚类分析 知识点题库

如图,只显示品牌为“比亚迪”的产品的销售数量,应该选择的操作是(   )

  
A . 插入图表 B . 排序 C . 分类汇总 D . 自动筛选
学校每周都要对各班级进行清洁评分,并将这些数据记录下来作为班级考核的重要依据。为了方便统计,可以利用Excel来制作数据表。
根据下图用函数填空:

①求参加语文考试的学生人数的函数:

②求所有同学数学成绩的平均分的函数:

③求总分最高的学生分数 的函数:

④求“谢娜”同学所在的等级的函数:

(说明:总分>=250,等级“优秀”,250>总分>=200,等级“良好”,200>总分>=160,等级“合格”,其他为“不合格”。)

小张收集了15个省份2017,2018上半年GDP数据,并使用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 要使表格第2行内容能完整显示,在不改变字号和列宽的前提下,下列操作可行的是(单选,填字母:A .选择B2:D2单元格,文本对齐格式设置为“垂直居中”/B .选择B2:D2单元格,文本对齐格式设置为“跨列居中”C .选择B2:D2单元格,文本对齐格式中的文本控制设置为“自动换行”)。
  2. (2) 若对图a中的“2018上半年GDP同比增速”和“2018上半年GDP总量(亿元)”两列进行筛选操作,筛选条件如图b所示,则按此设置筛选出的省份是

  3. (3) 根据图a中数据制作的图表如图c所示,创建该图表的数据区域是A2:B3,

  4. (4) 在E3单元格中使用RANK函数获得各省2018上半年GDP同比增速排名。再利用自动填充功能获得E4:E17单元格中的数据。则E17中的内容是。(提示:RANK函数用于返回某个数字在一系列数字中相对于其他数字的排名。例如:=RANK(E3,E3:E17)表示E3在数据区域E3:E17中的降序排名。)
小王收集了某中学教师欢乐四项赛得分的相关数据,并使用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 小王要通过自动填充将“报名号”列的值填充为如图a所示的序列“01,02,…,18”,则可先将该区域单元格格式设置为(单选,填字母:A .数值/B .货币/C .百分比/D .文本)。
  2. (2) 在5单元格中使用 SUMIF函数计算高三年级所有选手总分之和,则L5单元格中的公式是

    (提示:SUMIF函数用于对区域中满足条件的单元格求和。例如:=SUMIF(B3:B20,“高二”,I3:I20)表示高二年级所有选手总分之和)

  3. (3) 根据图a中数据制作的图表如图b所示,创建该图表的数据区域是

  4. (4) 市教育工会将举行“巾帼杯”欢乐四项赛,比赛项目为上述四项,计分规则不变。比赛规则:每校由2名女教师参加;每项每校由1名教师参赛每名教师参赛项不限;比赛成绩为4项得分的总和。以本次教师欢乐四项赛的结果为依据,从林雅璇、郦佳玲和董雯静中选择2名选手代表学校参加比赛。为使学校取得最高总分,你的选择是(单选,填字母:A .林雅璇与郦佳玲/B .林雅璇与董雯静/C .郦佳玲与董雯静)
为了直观地关注全国范围内新型冠状肺炎病毒感染的情况, 某同学使用Excel软件记录了2月4日至2月10日全国各省每天的累计确诊人数和治愈人数。部分界面如图1所示:

请回答下列问题:

  1. (1) 为了统计当天增加的确诊人数和治愈人数,该同学在039单元格使用公式已计算出2月10日的治愈增长人数,若在当前状态下使用自动填充的方式获得B39:N39单元格内的数据,C39单元格中的内容将为(单选,填选项:A .885/B .#REF!/C .#VALUE!/D .0)
  2. (2) 治愈率即当天的累计治愈人数占累计确诊人数的比重(治愈率=治愈/确诊*100%),为了计算截至2月10日的治愈率,应在N40单元格填写公式
  3. (3) 图2为部分省份某日疫情柱状图,绘制该图表的数据区域为:
  4. (4) 累计确诊人数超过1000人的地区为重点关注地区,为了了解国内有多少省份需要重点关注,可以使用“筛选”中的 (单选,填选项:A .最大10项/B .自定义筛选)获得。
小王收集了2017年8月我国50个城市部分食品平均价格变动情况,使用Excel软件对数据进行处理,界面如图所示。请回答下列问题:

图a

  1. (1) 已知 E14 单元格是由 C14 单元格复制公式得到的,则 E14 单元格中的公式为
  2. (2) 小米在操作时,不小心将 E3:E12 的数据删除,则 E14 单元格的值为(单选,填字母:A .“10”/ B .“0”/ C .“#DIV/0!”/ D .“#VALUE!”)
  3. (3) 如图 a 所示,若要将数据按照“食品名称”进行升序排序,应该选择的区域为           
  4. (4) 小王创建了如图 b 所示的图表,该图表的数据区域为

    图  b

小明进行研究性学习,对2019年国家和地区货物的进出口情况进行数据分析,如图所示:

  1. (1) 计算“占全部出口比重”这列数据,通过D5单元格中公式,对D6:D15进行自动填充,D15单元格显示的结果是:  (单选,填字母。A . #DIV/0!/B . 100.00/C . 0.84/D . 0.00)。
  2. (2) 若要正确的计算“占全部出口比重”列的数据,可对D5单元格中的公式进行更改,并对D6:D15进行自动填充,则D5单元格中的公式是:
  3. (3) 对于图b中,下列说法正确的是               (多选,填字母)

    A . 图表的数据区域是A5:A15,B5:B15,E5:E15。 B . 选定数据区域AS:G615,以列C为关键字进行升序排序,图表不会发生变化。 C . 隐藏数据第2至4行,图表不会发生变化。 D . 选定数据区域A3:G15,筛选出“出口额”最大的三个国家和地区,图表不会发生变化。
小张收集了某地部分市菜菜篮子价格数据,并使用Excel款件进行数据处理,如图所示。

  1. (1) 表中“平均值”数据是利用函数Average计算得到的,选择I3单元格输入公式,然后用自动填充功能完成其他单元格的计算。则I3单元格中的公式为
  2. (2) 为了分析数据的需要,创建了如图2所示的图表,则创建该图表时选择的数据区域为,B2,I2,B4:B5,I4:I5,

  3. (3) 若要对图1中所示数据按“最大差价”进行降序排列,则捕序时选择的数据区域
  4. (4) 对图1中的数据进行筛选,要找出“最大差价”最小的三个,可以选择进行筛选(单选,填字母:A .高于平均值/B .10个最大的值/C .自定义筛选)
以下属于大数据应用实例的是(     )。

①某系统通过用户视频点播的基础数据如评分、播放、快进等,分析计算出用户可能喜爱的影片,并为他提供定制化的推荐

②某网站通过追踪用户在其网络的行为,识别用户在它的网络中的好友,从而给出新的好友推荐建议

③某交通流量数据公司依靠分析历史和实时路况数据,能给出及时的路况报告,以帮助司机避开正在堵车的路段,并且帮他们提前规划好行程

④某保险公司天都会对美国境内超过100万个地点、未来两年的天气情况进行超过1万次模拟,而后将根系结构和土壤孔隙度的相关数据,与模拟结果相结合,为成千上万的农民提供农作物保险

A . ①②④ B . ①②③ C . ②③④ D . ①②③④
某公司2015年10月销售统计情况如图所示:

用饼图显示各品牌销售量占总销售量的比例,与此饼图对应的数据源范围以及数据产生的系列分别是(    )

A . A2:B8,系列产生在“行” B . A2:B8,系列产生在“列” C . A2:B7,系列产生在“行” D . A2:B7,系列产生在“列”
按照涉及自变量的多少,可以将回归分析分为(   )。(多选题)
A . 线性回归分析 B . 非线性回归分析 C . 一元回归分析 D . 多元回归分析 E . 综合回归分析
数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。
某超市通过研究销售数据,发现购买商品A的人购买商品B的概率很大,这种属于数据的(     )
A . 关联分析 B . 分类分析 C . 回归分析 D . 聚类分析
下列关于数据分析报告叙述错误是(     )
A . 数据分析报告是项目研究结果的展示 B . 数据分析报告是数据分析结论的有效承载形式 C . 通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来 D . 数据分析报告不能为决策者提供科学、严谨的决策依据
数据挖掘时指在庞大的数据库中寻找有价值的隐藏实践,加以分析,并将有意义的信息进行归纳,为决策提供参考依据和控制机制,因此,(      )是信息挖掘的第一步。
A . 数据清理 B . 数据收集 C . 数据变换 D . 数据归纳
某国的一家大型连锁超市通过利用信息系统对大量的销售数据进行了特定的分发现一个“奥秘”,于是这家超市就把尿布和啤酒这两种看起来没有关联的商品摆放在一起销售,结果销售量大幅增加。原来,超市经营者从数据分析中发现,婴儿尿布通常是男人们下班时购买的,而他们在购买尿布时又会顺便购买自己爱喝的啤酒。这个案例中的超市信息系统应用了大数据分析中的哪种技术?(  )
A . 聚类分析 B . 关联分析 C . 分类分析 D . 回归分析
当用户登录某网站购买、浏览、收藏了某些书籍后,再次登录该网站时,会发现网页上增加了“你可能感兴趣的书”以及“购买此商品的顾客也同时购买”之类的推送条目,如下图所示。

问题1:网站给用户自动推荐商品的依据是什么?采用了什么分析方法?

问题2:网站数据可能对用户产生哪些影响?

小王收集了2021年8月我国50个城市部分食品平均价格变动情况数据,并使用Excel软件对数据进行处理,如图a所示。

请回答下列问题:

  1. (1) 区域F3:F12 的数据是通过公式计算得到的,在F3单元格中输入公式 ,再使用自动填充功能完成区域F4:F12的计算。
  2. (2) 完成F3:F12的计算后,小王误删了第14行,则F3单元格中显示为(单选,填字母:A . #REF!\ B . #VALUE!\C . 30.93)
  3. (3) 小王根据EXCEL表中数据创建了如图b所示柱形图。结合图b,下列说法正确的有                。(多选,填字母)。

    A . 创建图b的数据区域为B2:E5 B . 由图可知,三种水产品8月份的价格相对稳定 C . 对区域A6:F12根据列C进行升序排列,则第13题图b会随之改变 D . 删除第13题图b中活草鱼中旬价格的柱子,则第13题图a中D4单元格的数值也会消失
小明上网查询了浙江省新冠疫情各个地级市的相关数据(截止4月28日16时),并制成了Excel表格,界面如图a所示,请回答下列问题。

图a

  1. (1) J4:J14区域的数据是通过J3的单元格进行自动填充得到的,则J3单元格的公式是 (累计确诊百分比=当前市累计确诊/总计累计确诊*100)

    图b

  2. (2) 根据第图a中数据制作的图表如图b所示,创建该图表的区域是
  3. (3) 下列描述正确的是          
    A . 若单元格C3被误删,则J3单元格显示为#REF! B . 若要对数据按照“累计确诊”进行排序,排序区域为A2:J14 C . 将A2:J13复制到新的工作表中,以“累计确诊”最大3项筛选,再按“新增本土”最大3项筛选,结果筛选出2条记录 D . 在列A后插入一列,J列“累计确诊占全省的百分比(%)”相应数据不发生变化 E . 对区域A2:J13按照“现有确诊”排序后,图b会发生变化
最近更新