第五章 数据处理和可视化表达 知识点题库

要统计全班同学的半期考成绩,用下列哪个软件比较快捷方便?(   )
A . 选用Microsoft Word设计表格统计成绩 B . 选用Microsoft Excel设计表格统计成绩 C . 选用Microsoft Powerpoint设计表格统计成绩 D . 选用WPS设计表格统计成绩
Excel文件的扩展名默认为(   )   
A . ppt B . doc C . xls D . htm
小张收集了15个省份2017,2018上半年GDP数据,并使用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 要使表格第2行内容能完整显示,在不改变字号和列宽的前提下,下列操作可行的是(单选,填字母:A .选择B2:D2单元格,文本对齐格式设置为“垂直居中”/B .选择B2:D2单元格,文本对齐格式设置为“跨列居中”C .选择B2:D2单元格,文本对齐格式中的文本控制设置为“自动换行”)。
  2. (2) 若对图a中的“2018上半年GDP同比增速”和“2018上半年GDP总量(亿元)”两列进行筛选操作,筛选条件如图b所示,则按此设置筛选出的省份是

  3. (3) 根据图a中数据制作的图表如图c所示,创建该图表的数据区域是A2:B3,

  4. (4) 在E3单元格中使用RANK函数获得各省2018上半年GDP同比增速排名。再利用自动填充功能获得E4:E17单元格中的数据。则E17中的内容是。(提示:RANK函数用于返回某个数字在一系列数字中相对于其他数字的排名。例如:=RANK(E3,E3:E17)表示E3在数据区域E3:E17中的降序排名。)
小红收集了12个月水、电、燃气和电话费的数据,并使用Excel软件进行数据处理,如图a所示。请回答下列问题:

图 a

  1. (1) 表格第1行中的标题“水、电、燃气和电话费的统计”可以在A1单元格中输入标题,合并区域后居中得到。
  2. (2) 表格中的费用(水费、电费、燃气费)是通过公式计算得到(如:电费=用电量×电费单价)。这些费用的计算结果在用水量、用电量、用气量或单价更改时仍正确,则G3单元格中的公式是
  3. (3) 根据图a所示的数据制作的图表如图b所示,下列描述不正确的是 (多选,填字母)。

    图b

    A.该图表的数据区域为 C15,E15,G15:I15

    B.若清除 I15 单元格中的内容,则该图表不会发生变化

    C.如将 A 列数据隐藏,该图表会发生变化

    D. 将 A2:I15 区域的数据按“小计(元)”为关键字进行降序排序,该图表会发生变化

  4. (4) 将图a中A2:L14区域的数据复制到新工作表对应区域并进行筛选,设置筛选条件如图c所示,则按此设置筛选出的月份个数共有个。

    图 c

浙江省的“健康码”管理信息系统以真实数据为基础,连通重点人员动态管控清单等相关数据库,根据群众申报信息与后台数据的校验比对结果生成个人二维码。下列说法不正确的是(    )
A . 群众录入申报信息是数据采集的过程 B . 生成个人二维码属于信息的解码 C . 健康码是大数据助力精准防疫的典型应用 D . 健康码状态需要实时更新,体现了信息的时效性
传统营销模式比基于大数据的营销模式针对性更强。
小张收集了某校图书馆借阅排行TOP300的相关数据,并用Excel软件进行处理,如图a所示:

图a

  1. (1) 为计算图a中的“流通次数”和“预约次数”,小张已利用公式正确计算了“流通次数”,他希望通过修改K3单元格的公式,利用自动填充得到“预约次数”L3:L7区域中正确的数据,则单元格K3中的公式应修改为。(提示:SUMIF函数用于求满足条件的单元格之和,例如=SUMIF(E3:E302,J3,G3:G302)用于求单元格区域E3:E302中与单元格J3中值相等的对应单元格区域G3:G302中的值之和。)
  2. (2) 根据图a中数据制作了图表如图b所示,则创建图表的数据区域

    图b

  3. (3) 根据图a所示,下列说法正确是           (多选题)
    A . 若表格已排序,则主要关键字是“流通人次”,次要关键字是“预约人次” B . 若以“类型”为文学,以“流通人次”最大的5项进行筛选,得到的记录数可能大于等于5条 C . 因误操作将“价格”所在列删除,则“流通次数”和“预约次数”的数据将不能正确计算 D . 若要找出文学类流通人次大于10次的书籍,则可以利用“类型”为文学,“流通人次”大于10进行筛选
小李收集了某书店主要畅销书销售情况的数据,并使用Excel软件对数据进行处理,如图所示。

  1. (1) 区域G3:G100的数据是通过公式计算得到的,在G3单元格中输入公式,再利用自动填充功能完成区域G4:G100的计算。
  2. (2) 对销售情况的数据以“定价(元)”为主要关键字按降序进行排序,则排序的数据区域是
  3. (3) 若在上图所示工作表中对数据进行进一步的操作,下列说法正确的是             (多选,填字母)。
    A . 若要制作一张关于《西游记》四个季度销量情况折线图,则图表的数据区域是A2:A3,C2:F3 B . 在“书籍名称”列前插入一列,“年销售金额”列的数值不会发生变化 C . 将对B3单元格的数值小数位数设置为0,则G3单元格的数值将变小 D . 分别筛选出第一季度销量和第二季度销量最大的3项,即可获得上半年销量排在前三的书籍
下图是2015年临海市事业单位公开招聘工作人员递补入围资格复审人员名单(二),请根据图中信息回答下列问题。

  1. (1) 笔试总成绩为综合基础知识或专业知识成绩(上午)和职业能力测验成绩(下午)组成,两部分成绩各占50%,在单元格H3中输入的公式是,然后利用自动填充功能完成剩余笔试总成绩计算。
  2. (2) 为计算排名值,可先对记录按笔试总成绩字段,然后利用自动填充功能在单元格I3:I13输入1、2、3……13。
  3. (3) 如果要选出所有护理岗位工作人员的信息,可以使用的工具是_                (填字母编号)。
    A . B . C . D .
  4. (4) 某同学根据表格数据制作了一张柱形图,如下图所示,笔试总成绩计算好后,图表(选填:会/不会)出现柱形。

下列 Excel 图表类型中,适合表示比例关系的是(    )。
A . 折线图 B . 条形图 C . 柱形图 D . 饼图
小李收集了2015-2017年各市城乡居民人均可支配收入情况数据,并使用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 区域I5:I16的数据是通过公式计算得到的:在I5单元格输入公式后,用自动填充功能完成16:I16的计算,则I5单元格中的公式是(增长率%=(当年可支配收入-上一年可支配收入)÷上一年可支配收入×100)。
  2. (2) 通过排序使得表格数据按“2017年增长率%”为关键字进行了降序排序,则选择的数据区域为
  3. (3) 根据图a中数据制作的图表如图b所示,创建该图表的数据区域是

  4. (4) 将区域A4:I15的数据复制到新工作表后,对“2016年增长率%”和“2017年增长率%”进行筛选操作,筛选设置如图c所示,则筛选出的城市有(填数字)个。

数据分析的常见方法包括平均分析、对比分析、交叉分析。
下列属于大数据特征的是(    )

①数据体量大    ②产生速度快    ③处理速度慢    ④数据类型多    ⑤价值密度高

A . ①②③ B . ①②④ C . ①②⑤ D . ②③④
下列有关数据演变的描述,按年代先后顺序排列,正确的是(   )

①远古时代,居住在洞穴中的原始人用石器或骨器在墙壁上刻画图案

②公元前3000多年,苏美尔人在泥板上用楔形文字记载“29086单位大麦37个月库辛” 的内容

③19世纪,爱迪生发明了留声机,得以将声音记录下来

④随着移动网络与传感器的普及,大数据进入了人们生活的方方面面

A . ②①④③ B . ①③②④ C . ①②③④ D . ③①②④
想要统计“本班学生最喜欢的动画片”,下列收集数据的方法比较合适的是(   )
A . 上网查找 B . 问卷调查 C . 观察 D . 查阅资料
如图是一张火车票,上面有时间、目的地、身份证号码等数据,则下列说法正确的有

①数据采集技术的迅速发展,数据的表现形式也越来越多样化,给人们的生活带来了巨大的改变

②只有云计算、物联网、大数据等技术才能体现数据与生活

③在人们的日常生活中数据无处不在

④对于身份证号码等涉及个人隐私的数据要注意保护

小杜收集了本校“物化技”选科班的期末成绩,并使用Exce1软件进行 数据处理,如图a所示。

请回答下列问题:

  1. (1) 小杜不小心将区域J3:J158执行“清除内容”操作,则单元格J160显示结果是(单选,填字母: A . 0.00 \B . #REF!\ C . #DIV/0!\ D . ####)
  2. (2) 在M4单元格中使用COUNTIFS函数,通过自动填充M4:S7统计各班各科及总分大于等于指定成绩的人数,则M4单元格中的公式为=COUNTIFS ($B$3: $B$158,$L4, )(提示: COUNTIFS函数用于统计区域中满足多个条件的单元格个数。例如:=COUNTIFS(B3:B158, L4, E3:E158, ">="&N3)统计区域B3: B158中满足条件为“高三1班”,且区域E3:E158中满足条件为“成绩大于等于130分”的人数)
  3. (3) 根据图a中数据制作了如图b所示的图表。结合图a和图b,下列说法正确的有        (多选,填字母)

    A . 创建图表的数据区域是L4:L7,S4:S7,并设置“数据标签格式"为百分比 B . 区域B2:J158以“技等”为主要关键字进行升序排序,图表不会随之改变 C . 表格中筛选出“英语"成绩为前5名的同学名单,图表不会随之改变 D . 选中区域B2:J158,以“班级”为主要关键字升序,“总分”为次要关键字降序排序,最前面的3名学生名单,一定为2班总分前3名的考生
小刚用问卷星平台创建问卷,调查高二学生饮食营养结构,并通过班级群公布问卷地址,完成了调查;小强通过发放纸质调查问卷并回收统计,也完成了同类问题的调查。以下说法不恰当的是(      )
A . 网络调查很容易扩大调查的范围 B . 网络调查结果的数据处理比较方便 C . 网络调查可以节省成本 D . 网络调查适宜所有调查
因疫情防控需要,学校要求学生家长及时上报体温、行程等数据,汇总后上报上级防控部门,采集上述数据最为高效的方法是(    ).
A . 填写在线收集表 B . 填写纸质表格 C . 发送电子邮件 D . 打电话上报
小明搜集了某网络购物平台2021年1月1日至2021年9月30日时间段内的日用化妆品销售数据,原始数据如下图a所示。

  1. (1) 小明对数据进行了整理,下列操作不恰当的是(   )(单选,填字母)。
    A . 发现记录中有6 条重复,对这6 条记录进行了删除 B . 发现记录中有38 处数据项缺失,直接删除相关记录 C . 将某条记录中订单日期“2050-6-9”订正为“2021-6-9” D . 将某条记录中订单日期“2021#3#11”修改为“2021-3-11”
  2. (2) 小明发现数据中仍有极少量时间段外的记录混杂其中,利用Python 及pandas 模块进行处理。请回答问题:

    ① 采用pandas 模块中的(单选:填字母:A .Series / B .DataFrame)

    数据结构存储全部数据会比较高效。

    ② 全部数据保存于变量df 中,为筛选出订单日期为2021 年第一季度内的所有记录,

    可以执行Python 语句df1 =  ,则df1 中保存筛选结果。(单选,填字母。

    提示:多条件筛选时,条件之间用“&”连接,表示需要同时满足这多个条件)

    A.df[ (df['订单日期'] <= '2021-1-1' ) & (df ['订单日期'] <= '2021-3-31') ]

    B.df [ (df ['订单日期'] >= '2021-1-1') & (df ['订单日期'] >= '2021-3-31') ]

    C.df [(df ['订单日期'] >= '2021-1-1') & (df ['订单日期'] <= '2021-3-31')]

  3. (3) 经过以上两步处理之后,为了解“所在地市”第一季度“订购数量”前10 名的情况,

    编写如下Python 程序段:

    #数据整理结果保存于变量df1中,代码略

    g = df1.groupby('所在地市', as_index = False).sum()

    print           )

    则划线处的代码可为(   )(多选,填字母)

    A . g.sort_values('订购数量',ascending = False) [0:10] B . g.sort_values('订购数量',ascending = True).tail(10) C . g.sort_values('订购数量',ascending = True)[0:10] D . g.sort_values('订购数量',ascending = False).head(10)
  4. (4) 根据以上数据整理结果,小明对第一季度所在地市的“订购数量”进行可视化处理,如图b所示。

    实现上述功能的Python程序部分代码如下:

    #按“所在地市”对第一季度数据分组并求和,再按“订购数量”升序排序

    #选取最后10条数据,存入变量s,代码略

    import matplotlib.pyplot as plt

    x = s['所在地市']

    y =

    plt.barh(x, y, color = 'r')

    plt.show( )

    程序中划线处代码应为

  5. (5) 小明借助大数据技术,对近几年来该网络购物平台的日用化妆品销售数据进行了分析。

    应用该分析结果可能提供的数据服务是(列举一条即可)。

最近更新