#DA101. 云南词条可视化

云南词条可视化

  1. 小曲获取关于云南百度百科词条的信息,并保存到yunnan.txt中,这属于数据收集方法中的: {{ select(1) }}
  • 实验数据
  • 调查研究
  • 网络数据
  • 系统日志
  • 传感器设备

  1. 下列关于词云图说法正确的是:

    image {{ multiselect(2) }}

  • 词云图是一种将文本数据进行可视化表达的方式
  • 词云图通过文字大小、字体颜色来展现词语出现的频率,字越大颜色越突出表明词频越高
  • 词云图包含文本中所有词语
  • 中文词云和英文词云的过程都是一样的
  • wordcloud库一般通过空格及标题提取词汇

小曲对云南百科词条词云可视化的制作过程主要分为下面几个过程,结合自己所学的内容进行分析下面的代码与内容。

image


  1. 下图代码主要属于词云可视化过程中的: {{ select(3) }}

    image

  • 导入外部处理库
  • 文本导入与读取
  • 数据整理与分词
  • 特征提取形成词云
  • 显示词云并保存

  1. 下图代码实现的功能读取文本数据,划线处的代码应该填写: {{ input(4) }}

    image


  1. 下图代码主要属于词云可视化过程中的: {{ select(5) }}

    image

  • 导入外部处理库
  • 文本导入与读取
  • 数据整理与分词
  • 特征提取形成词云
  • 显示词云并保存

  1. 下图代码实现的功能是删除列表ws中的单个词汇,划线处的代码为:{{ input(6) }}

    image


  1. 下图代码主要属于词云可视化过程中的: {{ select(7) }}

    image

  • 导入外部处理库
  • 文本导入与读取
  • 数据整理与分词
  • 特征提取形成词云
  • 显示词云并保存
  1. 在词云设计制作库中,负责绘图显示图形的库是: {{ select(8) }}
  • matplotlib
  • jieba
  • wordcloud
  • numpy
  • PIL.Image