#DA104. 【客观测评】三体小说数据可视化
【客观测评】三体小说数据可视化
- 小曲通过网络爬虫获取关于三体小说的内容,并保存到三体.txt中,这属于数据收集方法中的: {{ select(1) }}
- 实验数据
- 调查研究
- 网络数据
- 系统日志
- 传感器设备
小曲对三体小说三部曲的制作过程主要分为下面几个过程,结合自己所学的内容进行分析下面的代码与内容。
-
下图代码主要属于词云可视化过程中的: {{ select(2) }}
- 导入外部处理库
- 文本导入与读取
- 数据整理与分词
- 特征提取形成词云
- 显示词云并保存
-
下图代码主要属于词云可视化过程中的: {{ select(3) }}
- 导入外部处理库
- 文本导入与读取
- 数据整理与分词
- 特征提取形成词云
- 显示词云并保存
-
下图代码实现的功能是将字符长度大于等于2的字符,添加到新的列表word2中,不修改原有的列表words。 代码13划线处的缺的代码为:{{ input(4) }}; 代码14划线处的缺的代码为:{{ input(5) }}; 代码15划线处的缺的代码为:{{ input(6) }}。
- 在词云设计制作库中,负责中文分词的库是: {{ select(7) }}
- matplotlib
- jieba
- wordcloud
- numpy
- PIL.Image
-
下列关于词云图说法错误的是:
{{ multiselect(8) }}
- 词云图是一种将文本数据进行可视化表达的方式
- 词云图包含文本中所有词语
- wordcloud库一般通过空格及标题提取词汇
- 中文词云和英文词云的过程都是一样的
- 词云图通过文字大小、字体颜色来展现词语出现的频率,字越大颜色越突出表明词频越高
- 通过词云图可见三体三本小说的主角是同一个人