#DA104. 【客观测评】三体小说数据可视化

【客观测评】三体小说数据可视化

  1. 小曲通过网络爬虫获取关于三体小说的内容,并保存到三体.txt中,这属于数据收集方法中的: {{ select(1) }}
  • 实验数据
  • 调查研究
  • 网络数据
  • 系统日志
  • 传感器设备

小曲对三体小说三部曲的制作过程主要分为下面几个过程,结合自己所学的内容进行分析下面的代码与内容。

image


  1. 下图代码主要属于词云可视化过程中的: {{ select(2) }}

    image

  • 导入外部处理库
  • 文本导入与读取
  • 数据整理与分词
  • 特征提取形成词云
  • 显示词云并保存

  1. 下图代码主要属于词云可视化过程中的: {{ select(3) }}

    image

  • 导入外部处理库
  • 文本导入与读取
  • 数据整理与分词
  • 特征提取形成词云
  • 显示词云并保存

  1. 下图代码实现的功能是将字符长度大于等于2的字符,添加到新的列表word2中,不修改原有的列表words。 代码13划线处的缺的代码为:{{ input(4) }}; 代码14划线处的缺的代码为:{{ input(5) }}; 代码15划线处的缺的代码为:{{ input(6) }}。

    image


  1. 在词云设计制作库中,负责中文分词的库是: {{ select(7) }}
  • matplotlib
  • jieba
  • wordcloud
  • numpy
  • PIL.Image

  1. 下列关于词云图说法错误的是:

    image {{ multiselect(8) }}

  • 词云图是一种将文本数据进行可视化表达的方式
  • 词云图包含文本中所有词语
  • wordcloud库一般通过空格及标题提取词汇
  • 中文词云和英文词云的过程都是一样的
  • 词云图通过文字大小、字体颜色来展现词语出现的频率,字越大颜色越突出表明词频越高
  • 通过词云图可见三体三本小说的主角是同一个人