- 词云可视化
小说文本词云可视化(多个字符)
- 2023-12-4 11:46:50 @
通过回复讨论分享你喜欢的小说或作家,并通过python生成该作家小说作品的多个字符的词云图。 通过词云你有什么发现,可以在讨论区中分享你的思考。
38 条评论
-
kyxs202301041 LV 1 @ 2023-12-4 18:18:08
作品名称:《乡土中国》
作者:费孝通
分析内容:中文分词后,对小说《乡土中国》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:社会、我们、一个、可以、乡土 社会、没有、发生、不是、但是、生活
我的观察与思考:词频最高的是“社会”,说明本书主要围绕社会以及社会问题展开。“乡土 社会”出现频率也较高,展现出《乡土中国》的主要内容。“我们”“一个”“可以”等词汇是现代文中常用词汇。
词云图:
词频统计:
-
2023-12-4 18:17:29@
作品名称:《呐喊》
作者:鲁迅
分析内容:中文分词后,对小说《呐喊》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:没有,一个,他们,自己,知道,什么,因为,呐喊,天涯,然而
我的观察与思考:小说中的重要篇幅有阿Q正传等,小说人物众多。同时看到里面的其他词汇,也能让人想起作者在这些地方的着墨较多,通过辫子等词语也可以大体推测作者描述的时代背景。 词云:
词频分析:
-
2023-12-4 18:13:32@
-
作品名称:《额尔古纳河右岸》
作者:迟子建
分析内容:中文分词后,对小说《额尔古纳河右岸》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:我们,时候,芙琳,他们,一个,驯鹿,它们,达西,没有
我的观察与思考:小说中的主要人物有、芙琳、达西,地点发生在东北,小说人物众多。同时看到里面的其他词汇,也能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景。
词云图:
词频统计:
-
-
2023-12-4 18:11:45@
作品名称:《骆驼祥子》
作者:老舍
分析内容:中文分词后,对小说《骆驼祥子》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:自己,可是,祥子,什么,没有,不能,他们,虎妞,这个,一个
我的观察与思考:小说中的主要人物有祥子、虎妞等,小说人物众多。同时看到里面的其他词汇,也能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景。
-
2023-12-4 18:08:00@
作品名称:《狼图腾》
作者:姜戎
分析内容:中文分词后,对小说《狼图腾》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:陈阵、草原、小狼 、一个、狼群、没有、老人、就是、自己、杨克
我的观察与思考:姜戎多使用连词,从‘陈阵’‘小狼’‘草原’‘狼群‘中看出这部小说是关于人与草原的关系的探索。 词云图:
词频统计:
-
2023-12-4 18:05:57@
作品名称:《围城》
作者:钱钟书
分析内容:中文分词后,对小说《围城》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:鸿渐,自己,辛楣,小姐,没有,知道,一个,他们,孙小姐,什么
我的观察与思考:小说中的主要人物有鸿渐、辛楣、孙小姐等,小说人物众多。同时看到里面的其他词汇,也能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景。
词云图:
词频统计:
-
2023-12-4 18:05:36@
作品名称:《狼图腾》
作者:姜戎
分析内容:中文分词后,对小说《狼图腾》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:陈阵、草原、小狼、一个、狼群、没有、老人、就是、自己、马群
我的观察与思考:根据对文本的分析可知,小说主要角色是陈阵,发生在草原上,围绕狼展开
-
2023-12-4 18:00:00@
作品名称:《长安十二时辰》
作者:马伯庸
分析内容:中文分词后,对小说《长安十二时辰》单个词汇的词频统计及分析
词汇量最多前10个单个字符词汇:的、他,了、在,张小敬,是,李泌、你、有,把 我的观察与思考:“的”是现代文本中常用助词,“我”、“他”、“她”常用的代词。马伯庸的单个词汇挺丰富。 词云图:
-
2023-12-4 17:59:05@
作品名称:《阿Q正传》
作者:鲁迅
分析内容:中文分词后,对小说《鲁迅》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:quot,quot quot,没有,一个,他们,自己,知道,什么,因为,呐喊
我的观察与思考:鲁迅多使用连词,从‘然而’‘所以’‘似乎’‘因为‘中看出鲁迅语言连贯性强,极富特色。
词云图:
词频统计:
-
2023-12-4 17:58:49@
作品名称:《围城》
作者:钱钟书
分析内容:中文分词后,对小说《围城》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇: 鸿渐、自己、辛楣、小姐、没有、知道、一个、他们、孙小姐、什么
词云图:
-
2023-12-4 17:56:43@
作品名称:《海底两万里》
作者:儒勒·凡尔纳
分析内容:中文分词后,对小说《海底两万里》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:我们、quot quot、没有、可以、留斯号、尼摩 船长、它们、一个、这些、时候
我的观察与思考:根据对文本的分析可知,小说主要角色是尼摩船长
词云图:
词频统计:
-
2023-12-4 17:53:12@
作品名称:《寂静的春天》
作者:蕾切尔·卡逊
分析内容:中文分词后,对小说《寂静的春天》单个词汇的词频统计及分析
词汇量最多前10个单个字符词汇:一个、这些、它们、我们、这种、昆虫、一种、杀虫剂、一些、可能
我的观察与思考:批判人类对化学产品的滥用,导致寂静的春天的产生和到来,教导人们保护环境。 词云图: image
-
2023-12-4 17:49:38@
作品名称:《命若琴弦》
作者:史铁生
分析内容:中文分词后,对小说《命若琴弦》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:瞎子、师父、什么、兰秀儿、琴弦 天涯、命若 琴弦、知道、匣子、野羊坳、自己
我的观察与思考:小说中的主要人物有瞎子、师父、兰秀儿等,小说人物众多。同时看到里面的词汇关注到、琴弦 天涯、命若 琴弦、野羊坳等,这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景。让人十分期待几位主人公的精彩故事。
词云图:
-
2023-12-4 17:43:38@
作品名称:《平凡的世界》
作者:路遥
分析内容:中文分词后,对小说《平凡的世界》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:他们、一个、自己、现在、已经、少平、这个、没有、什么、知道
我的观察与思考:小说中的主要人物有少平等,小说人物不多。表示时间的词有“现在”,表示代词的词有“他们”“一个”“这个”。小说描绘主人公的词语不多,多用代词来表示人物。
词云图:
-
2023-12-4 16:12:07@
-
2023-12-4 16:11:50@
作品名称:《边城》
作者:沈从文
分析内容:中文分词后,对小说《边城》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:(322, '翠翠') (279, '祖父') (175, '一个') (145, '船夫') (145, '二老') (95, '什么') (84, '边城 天涯') (79, '自己') (79, '渡船') (72, '那个') (71, '爷爷') (70, '明白') (68, '事情')
我的观察与思考:小说中的词汇出现最多的是”社会”这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景,作者这本书的主要内容。
-
2023-12-4 16:11:49@
-
作品名称:《乡土中国》
作者:费孝通
分析内容:中文分词后,对小说《乡土中国》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:社会,我们,一个,可以,乡土 社会,没有,发生,不是,但是,生活
我的观察与思考:小说中的词汇出现最多的是”社会”这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景,作者这本书的主要内容。
词云图:
-
-
2023-12-4 16:11:35@
-
2023-12-4 16:11:34@
作品名称:《巴黎圣母院》
作者:维克多·雨果
分析内容:中文分词后,对小说《巴黎圣母院》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:一个、我们、没有、这个、什么、那个、可以、他们、巴黎圣母院、巴黎
我的观察与思考:小说中的主要故事发生在巴黎圣母院,也可以大体推测作者描述的时代背景。
词云图:
词频统计:
-
2023-12-4 16:11:29@
作品名称:《朝花夕拾》
作者:鲁迅
分析内容:中文分词后,对小说《朝花夕拾》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词: '没有' '因为' '知道' '我们' '现在' '然而' '无常' '什么' '时候' '朝花夕拾 天涯'
我的观察与思考:小说中的主要人物有我,小说人物比较少。可以大体推测作者描述的时代背景。
-
2023-12-4 16:11:16@
词云图:
词频统计:
-
2023-12-4 16:09:50@
作品名称:《草房子》
作者:曹文轩
分析内容:中文分词后,对小说《草房子》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:社会,我们,一个,可以,乡土,
我的观察与思考:小说主要写中国社会现状。
词云图:
-
2023-12-4 16:09:26@
作品名称:《平凡的世界》
作者:路遥
分析内容:中文分词后,对小说《平凡的世界》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:他们、一个、自己、现在、已经、少平、这个、没有 、什么、知道
我的观察与思考:小说中的主人公是孙少平。词汇量最多的词都比较简单,说明路遥写作风格简朴亲切,小说通俗易懂。 词云图:
词频分析:
-
2023-12-4 16:08:49@
作品名称:《许三观卖血记》
作者:余华
分析内容:中文分词后,对小说《许三观卖血记》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:许三观 他们 许玉兰 你们 没有 一乐 何小勇 我们 一个 自己
我的观察与思考:小说中的主要人物有许三观,许玉兰,何小勇等,小说人物众多。这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景。
-
2023-12-4 16:08:44@
作品名称:《秦腔》
作者:贾平凹
分析内容:中文分词后,对小说《秦腔》多个字符的词汇词频统计及分析词汇量最多前10个多个字符的词汇:夏天、白雪、君亭、夏风、没有、一个、四婶、就是、智说
我的观察与思考:小说中的主要词汇有夏天、白雪、君亭、夏风,这能让人想起作者在背景地点的着墨较多,同时也可以大体推测作者所蕴含的情感。
-
2023-12-4 16:08:22@
作品名称:《尘埃落定》
作者:阿来
分析内容:中文分词后,对小说《尘埃落定》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:土司, 我们, 他们, 一个, 没有, 父亲, 自己, 知道, 什么, 一样
我的观察与思考:小说中的主要人物有傻子,麦琪土司,塔娜,翁波意西等,小说人物众多。同时看到里面的词汇关注到土司、管家、碉楼,书记官等,这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景,解放前西藏土司制度的不平等,与傻子跟上时代的故事
词云图:
-
2023-12-4 16:08:20@
作品名称:《乡土中国》
作者:费孝通
分析内容:中文分词后,对小说《乡土中国》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:社会,我们,一个,可以,乡土 社会,没有,发生,不是,但是,生活
我的观察与思考:小说中的词汇出现最多的是”社会”这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景,作者这本书的主要内容。
词云图:
-
2023-12-4 16:08:06@
作品名称:《冰心集》 作者:冰心 分析内容:词汇量最多前10个单个字符词汇:冰心,文集,什么,一个,自己,没有,然而,天涯,找到,这个 我的观察与思考:“的”是现代文本中常用助词,“我”、“他”、“她”常用的代词。冰心的单个词汇挺丰富 词云图:
词汇统计:
-
2023-12-4 16:07:46@
作品名称:《追风筝的人》
作者:卡勒德.胡赛尼
分析内容:中文分词后,对小说《追风筝的人》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:我们、爸爸、哈桑、他们、没有、知道、一个、那个、什么、索拉博
我的观察与思考:小说中的主要人物有哈桑、哈桑的爸爸、索拉博等,小说人物众多。同时看到里面的词汇关注到阿富汗,这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景。
词云图:
词频统计:
-
2023-12-4 16:07:03@
作品:《三体》
作者:刘慈欣
分析内容:中文分词后,对小说《三体》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:一个、程心、可能、没有、他们、我们、自己、已经、知道、就是
我的观察与思考:小说中的主要人物有程心,罗辑等,且程心次数最多、故程心为其中主要人物。人称代词多、表明对话多、蕴含作者思考。之后出现“宇宙“”太阳”,说明科幻题材,世界观较大,应为不错的科幻小说。
-
2023-12-4 16:06:24@
作品名称:《茶花女》 作者:小仲马 分析内容:中文分词后,对小说《茶花女》多个字符的词汇词频统计及分析 我的观察与思考:《茶花女》里,以细腻的笔触、深情的语言,抒写了作为一个人的妓女的思想和感情,希望和绝望。 词云图:
词频统计:
-
2023-12-4 16:04:59@
作品名称:《草房子》
作者:曹文轩
分析内容:中文分词后,对小说《草房子》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:桑桑、一个、桑乔、没有、一轮、看到、草房子 天涯、白雀、父亲、自己
我的观察与思考:小说以桑桑为主要人物展开叙述,以桑桑的回忆,描写了杜小康、纸月、白雀等人,人物丰富,描写细腻。描绘桑桑的童年在油麻地度过,作者对农村生活的描写着墨较多,同时也可以大体推测作者描述的背景。
词云图:
词频统计:
-
2023-12-4 16:03:55@
作品名称:《海边的卡夫卡》
作者:村上春树
分析内容:中文分词后,对小说《海边的卡夫卡》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:中田、没有、什么、星野、大岛、一个、不是、那里、自己、佐伯
我的观察与思考:小说中的主要人物有中田,星野,大岛,佐伯等,小说人物众多。同时看到里面的词汇关注到图书馆、海边等,这能让人想起作者在这些地方的着墨较多,同时也可以大体了解故事发生的地方
词云图
词频分析
-
2023-12-4 16:03:12@
作品名称:《平凡的世界》
作者:路遥
分析内容:中文分词后,对小说《平凡的世界》多个词汇的词频统计及分析
词汇量最多前10个单个字符词汇:'他们') '一个' '自己', '现在', '已经', '少平', '这个', '没有', '什么', '知道', '这样', '平凡 世界', '全三册 天涯' , '世界 全三册', '两个', '就是', '少安', '我们', '时候', '生活'
我的观察与思考:文中重点人物为孙少平 孙少安 口语化词汇比较多 朴素而真实
词云图:
词频统计:
-
2023-12-4 16:02:20@
作者:刘慈欣
分析内容:中文分词后,对小说《三体》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:一个、汪淼、叶文洁、没有、他们、我们、自己、这个、知道、就是
我的观察与思考:小说中的主要人物有汪淼、叶文洁等,且汪淼次数最多、故汪淼为其中主要人物。人称代词多、表明对话多、蕴含作者思考。之后出现“宇宙“”太阳”,说明科幻题材,世界观较大,应为不错的科幻小说。(所以“quot“是什么玩意儿?)
词云图:
词频统计:
-
2023-12-4 16:02:06@
作品名称:《鼠疫》
作者:[阿尔贝·加缪]
分析内容:中文分词后,对小说《鼠疫》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:他们、一个、医生、人们、没有、但是、这种、朗贝尔、我们、这些
我的观察与思考:文中代词运用频繁,多是泛指人们,视角宏大
词云图:
-
2023-12-4 15:53:27@
作品名称:《浮躁》
作者:贾平凹
分析内容:中文分词后,对小说《浮躁》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:金狗、小水、一个、什么、福运、田中、英英、韩文、大空、他们
我的观察与思考:小说中的主要人物有金狗、小水、英英、韩文等,小说人物众多,这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景。
词云图:
词频统计:
-
2023-12-4 11:54:27@
作品名称:《活着》
作者:余华
分析内容:中文分词后,对小说《活着》多个字符的词汇词频统计及分析
词汇量最多前10个多个字符的词汇:家珍、凤霞、有庆、我们、知道、看到、二喜、自己、起来、他们
我的观察与思考:小说中的主要人物有家珍、凤霞、有庆、富贵等,小说人物众多。同时看到里面的词汇关注到队长、村里、医生等,这能让人想起作者在这些地方的着墨较多,同时也可以大体推测作者描述的时代背景。
词云图:
词频统计:
- 1