#DA101. 云南词条可视化
云南词条可视化
- 小曲获取关于云南百度百科词条的信息,并保存到yunnan.txt中,这属于数据收集方法中的: {{ select(1) }}
- 实验数据
- 调查研究
- 网络数据
- 系统日志
- 传感器设备
-
下列关于词云图说法正确的是:
{{ multiselect(2) }}
- 词云图是一种将文本数据进行可视化表达的方式
- 词云图通过文字大小、字体颜色来展现词语出现的频率,字越大颜色越突出表明词频越高
- 词云图包含文本中所有词语
- 中文词云和英文词云的过程都是一样的
- wordcloud库一般通过空格及标题提取词汇
小曲对云南百科词条词云可视化的制作过程主要分为下面几个过程,结合自己所学的内容进行分析下面的代码与内容。
-
下图代码主要属于词云可视化过程中的: {{ select(3) }}
- 导入外部处理库
- 文本导入与读取
- 数据整理与分词
- 特征提取形成词云
- 显示词云并保存
-
下图代码实现的功能读取文本数据,划线处的代码应该填写: {{ input(4) }}
-
下图代码主要属于词云可视化过程中的: {{ select(5) }}
- 导入外部处理库
- 文本导入与读取
- 数据整理与分词
- 特征提取形成词云
- 显示词云并保存
-
下图代码实现的功能是删除列表ws中的单个词汇,划线处的代码为:{{ input(6) }}
-
下图代码主要属于词云可视化过程中的: {{ select(7) }}
- 导入外部处理库
- 文本导入与读取
- 数据整理与分词
- 特征提取形成词云
- 显示词云并保存
- 在词云设计制作库中,负责绘图显示图形的库是: {{ select(8) }}
- matplotlib
- jieba
- wordcloud
- numpy
- PIL.Image