- 词云词频可视化
二十四史古文词频统计-2024级高一
- 2024-12-9 15:10:03 @
在二十四史原文中选择一本史书进行分析。通过回复讨论形式完成。
回复格式要求参考下面实例。
小组选择史书:《史记》
数据分析小组:齐洪
所选择史书简介:
《史记》是中国第一部纪传体通史,由司马迁撰写,记载了从黄帝时代到汉武帝时期约三千年的历史。它以纪传体的形式,全面系统地展现了中国古代的历史面貌,包括政治、经济、文化、思想等各个方面。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析
(词频出现最多单字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点)
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析
(词频出现最多多字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点)
3.史书词汇可视化总结分析
(结合单字到多字变化,以及常用词语和史书所反映时代,进行分析)
(可以使用人工智能工具(如https://www.doubao.com/chat/等) 查询如何从已有词云图中提取信息)
4.词云可视化的优点与不足
(结合你所选择的史书词云图进行分析)
附录1:二十四史原文版本
史书名称及作者 | 作者朝代 | 史书名称及作者 | 作者朝代 |
---|---|---|---|
01《史记》司马迁 | 西汉 | 02《汉书》班固 | 东汉 |
03《后汉书》范晔 | 南朝宋 | 04《三国志》陈寿 | 西晋 |
05《晋书》房玄龄等 | 唐朝 | 06《宋书》沈约 | 南朝梁 |
07《南齐书》萧子显 | 南朝梁 | 08《梁书》姚思廉 | 唐朝 |
09《陈书》姚思廉 | 唐朝 | 10《魏书》魏收 | 北齐 |
11《北齐书》李百药 | 12《周书》令狐德棻等 | 唐朝 | |
13《隋书》魏征等 | 14《南史》李延寿 | ||
15《北史》李延寿 | 16《旧唐书》刘昫等 | 后晋 | |
17《新唐书》欧阳修、宋祁 | 北宋 | 18《旧五代史》薛居正等 | 北宋 |
19《新五代史》欧阳修 | 《宋史》脱脱等 | 元朝 | |
21《辽史》脱脱等 | 元朝 | 22《金史》脱脱等 | |
23《元史》宋濂等 | 明朝 | 24《明史》张廷玉等 | 清朝 |
这个表格列出了中国历史上的二十四部官方史书及其主要编撰者,以及作者所在的朝代,按照各朝代顺序排列。
附录2:词云可视化参考代码
#导入数据分析的外部库
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import wordcloud as wc
import jieba
import pandas as pd
import re
#先将数据文件打开并读取
f=open("01史记.txt",encoding="ANSI")
fs=f.read()
f.close()
# 使用正则表达式替换标点符号和空格为一个空格
#fs = re.sub(r'[^\w]', ' ', fs)
# 将多个连续空格替换为一个空格
#fs = re.sub(r'\s+', ' ', fs)
#使用正则表达式替换非汉字字符为一个空格
fs = re.sub(r'[^\u4e00-\u9fff]+', ' ', fs)
#通过jieba分词库对中文进行分词
words=jieba.lcut(fs)
word2=[]
word3=[]
for w in words:
if len(w)>1 and (w not in word3):
word2.append(w)
ws=" ".join(words)
ds=" ".join(word2)
#绘制词云图1-单字
bg = np.array(Image.open("形状1.jpg"))
a=wc.WordCloud(font_path="simhei.ttf",mask=bg)
a.generate(ws)
plt.imshow(a)
plt.savefig(fname="词云1.png")
plt.show()
#绘制词云图2-多字
bg = np.array(Image.open("形状1.jpg"))
a=wc.WordCloud(font_path="simhei.ttf",mask=bg,background_color="white")
a.generate(ds)
plt.imshow(a)
plt.savefig(fname="词云2.png")
plt.show()
#词频统计
plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']
data1={"词语":words,"词频":0}
data2={"词语":word2,"词频":0}
pd1=pd.DataFrame(data1)
pd2=pd.DataFrame(data2)
a1=pd1.groupby("词语").count()
a1=a1.sort_values("词频",ascending=False)
print(a1.head(30))
a1.iloc[1:31].plot(kind='bar',rot=60)
plt.savefig(fname="词频1.png")
plt.show()
a2=pd2.groupby("词语").count()
a2=a2.sort_values("词频",ascending=False)
print(a2.head(30))
a2.head(30).plot(kind='bar',rot=60)
plt.savefig(fname="词频2.png")
plt.show()
30 条评论
-
kyxs240152 @ 2024-12-18 11:16:47
小组选择史书:《汉书》 数据分析小组:周子朔 段文博 所选择史书简介:《汉书》,又称《前汉书》,是中国第一部纪传体断代史,“二十四史”之一。由汉朝东汉时期史学家班固编撰,前后历时二十余年,于建初年中基本修成,后唐朝颜师古为之释注。其中《汉书》八表由班固之妹班昭补写而成,《汉书》天文志由班固弟子马续补写而成。 1.单字词汇可视化 (1)单字词云图及词频统计
(2)单字我们小组的发现与分析 之字最多 2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析 天下二字最多 3.史书词汇可视化总结分析 表现出了汉代的时代特点:“天下”最多说明汉代专注大一统观念的灌输;“匈奴”二字同样较多说明汉代最大的敌人是匈奴政权 4.词云可视化的优点与不足 优点 省事 快捷 缺点 具有一定片面性 门槛高
-
2024-12-17 12:42:34@
小组选择史书:《史记》 数据分析小组:杨弓麟 杨长麟 所选择史书简介: 基本信息 原名:《太史公书》《太史公记》《太史记》等,东汉末年荀悦所著的《汉纪》开始称其为《史记》,之后逐渐成为人们熟知的书名. 作者:司马迁,字子长,龙门(今陕西省渭南市韩城)人,诞生于史官世家。他年轻时遍览群书,周游各地搜索材料,积累了丰富的知识和素材. 篇幅:全书共有一百三十篇,包括本纪十二篇,表十篇,书八篇,世家三十篇,列传七十篇,共计五十二万六千五百余字. 时间跨度:从传说中的黄帝为起点,一直写到汉武帝元狩元年(公元前 122 年),讲述了中国约 3000 年的历史.
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析 之字最多
2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析 天下 诸侯 较多
3.史书词汇可视化总结分析 史学价值:《史记》是中国第一部纪传体通史,开创了纪传体史书的先河,为后世纪传体史书的创作树立了典范,其体例被后世正史所继承和发展。它全面、系统地记录了从黄帝到汉武帝时期的历史,为后人研究古代历史提供了丰富、详实的资料. 文学价值:司马迁的写作风格独具一格,既有严谨的历史考证,又有生动的文学描写。他善于用简练而富有表现力的语言,刻画人物的性格与情感,通过大量的对话与叙述手法,使历史人物的形象更加鲜活,让《史记》不仅是一部历史著作,也是一部文学经典,对后世文学创作产生了深远影响. 思想价值: 司马迁在《史记》中提倡 “究天人之际,通古今之变,成一家之言”,表达了他对历史发展规律、人与自然关系以及历史人物的深刻见解和道德评判,体现了他的史学思想和人生观、价值观,对后世的哲学思考和社会思想也产生了一定的启示作用.
4.词云可视化的优点与不足 优点 省事 快捷 缺点 具有一定片面性 门槛高
-
2024-12-17 0:16:44@
小组选择史书:《北史》
数据分析小组:吴佳霖 钟佳谕
所选择史书简介:
《北史》是二十四史之一,是汇合并删节记载北朝历史的《魏书》、《北齐书》、《周书》、《隋书》而编成的纪传体史书。魏本纪五卷、齐本纪三卷、周本纪二卷、隋本纪二卷、列传八十八卷,共一百卷。记述从北魏登国元年(386年(丙戌年))到隋义宁二年(618年)的历史。《南史》与《北史》为姊妹篇,是由李大师及其子李延寿两代人编撰完成的。《北史》包括本纪12卷,列传88卷,共计100卷,所记历史自北魏道武帝建国开始(公元386年),直到隋恭帝义宁二年(公元618年)结束,共计233年。书中主要记载了北魏、东魏、西魏、北齐、北周、隋这几个朝代的兴衰。《北史》的12卷本纪包括:魏本纪5卷、齐本纪3卷、周本纪2卷、隋本纪2卷。
1.多字词汇可视化
### (1)多字词云图及词频统计
最多的词汇是刺史,体现了官职的重要性
2.单字词汇可视化
(1)单字词云图及词频统计
最多出现的字是之,这是古代文言文的特点
3.史书词汇可视化总结分析
这些图展现了《北史》每一种字和词汇出现的频率的多少
4.词云可视化的优点与不足
范围过泛,不能及时提取我们想要的字符;并且不能展示史书的内容
-
2024-12-17 0:02:43@
《南齐书》
小组选择史书:《南齐书》
数据分析小组: 陈柯名 刘梦晨
所选择史书简介: 《南齐书》为“二十四史”之一,是南朝梁萧子显所撰的历史书,书中记述了南朝萧齐王朝自齐高帝建元元年(公元479年)至齐和帝中兴二年(公元502年),共二十三年史事,是现存关于南齐最早的纪传体断代史。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析
“之”“而”“为”“也”等虚词出现次数最多,反映出鲜明的古汉语特点
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析
“将军”“刺史”等官职(词云图中显示不全)出现次数最多,体现了南齐的政治制度
3.史书词汇可视化总结分析
《南齐书》具古汉语特点,反映出南齐的社会面貌
4.词云可视化的优点与不足
优点:视觉冲击力强,信息传递直观,制作简便,适用范围广,视觉效果美观。
不足:词语展示不全面,区分度不足,使用场景单一,主要用于分析文章,展示词频,但不适合其他类型的数据分析。
-
2024-12-16 15:20:32@
小组选择史书:《史记》
数据分析小组:欧阳子晨 陈禹霏
所选择史书简介:
《陈书》是唐朝人姚思廉所著的史学作品,属二十四史之一,是一本纪传体史类书,凡三十六卷,记载南朝陈朝史。成书于贞观十年(公元636年)。 《陈书》是姚思廉继承其父姚察的遗志,奉唐太宗之命编写而成的。 《陈书》的内容主要是取自姚察所写南朝陈史的资料,也融汇了他人所作的史料。
1.单字词汇可视化 (1)单字词云图及词频统计
(2)单字我们小组的发现与分析
之 为 而 以 等虚词使用比较多,这是文言文最明显的特点
(词频出现最多单字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点)
2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析
高祖 将军 刺史 太守 尚书,出现了大量的古代官职名,说明当时陈家出了许多的官员?(纯猜测)
(词频出现最多多字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点)
3.史书词汇可视化总结分析
“战”数量较多,说明当时各国间纷争不断,可能出现了各种大大小小的局部或全面战争?
(结合单字到多字变化,以及常用词语和史书所反映时代,进行分析)
(可以使用人工智能工具(如https://www.doubao.com/chat/等) 查询如何从已有词云图中提取信息)
4.词云可视化的优点与不足
弊端:词云图的统计并不全面,存在信息缺漏的问题,它只能有个对文章内容大概的呈现 好处:速度快,能立即查看到不同信息的对比
(结合你所选择的史书词云图进行分析)
-
2024-12-16 15:17:29@
小组成员:陈纪红,李祉娴 简介:《宋书》,二十四史之一,由南朝梁沈约(441─513年)等人所著。沈约学术渊博,才华出众。齐武帝永明五年(487)奉诏撰《宋书》,写成本纪10篇、列传60篇、志30篇,共一百篇。《宋书》的志有八类,包括《律历志》、《礼志》、《乐志》、《天文志》、《符瑞志》、《五行志》、《州郡志》、《百官志》,号称《宋书》八书,分量占全书的一半。 分析:我们发现之,曰等连词最多,具有古文特点,基本无实词,太祖,高祖,天下等较多
小组成员:陈纪红,李祉娴 简介:《宋书》,二十四史之一,由南朝梁沈约(441─513年)等人所著。沈约学术渊博,才华出众。齐武帝永明五年(487)奉诏撰《宋书》,写成本纪10篇、列传60篇、志30篇,共一百篇。《宋书》的志有八类,包括《律历志》、《礼志》、《乐志》、《天文志》、《符瑞志》、《五行志》、《州郡志》、《百官志》,号称《宋书》八书,分量占全书的一半。 分析:我们发现之,曰等连词最多,具有古文特点,基本无实词,太祖,高祖,天下等较多
-
2024-12-16 15:15:54@
小组选择史书:《晋书》
数据分析小组:付桂竹,王乙涵
所选择史书简介:
《晋书》是中国的“二十四史”之一,由唐代房玄龄等二十一位大臣合著。该书记载了西晋和东晋的历史,时间跨度从东汉末年司马懿早年直到东晋恭帝元熙二年(420年),刘裕废晋帝自立,以宋代晋。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析
而,也,之,已出现次数最多,因为古时连接词和现在不一样较简洁典雅,风格典雅,有文学性
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析
这本书中出现最多的词汇是:将军 他们 司马 皇帝 自己 太守 刺史等。因为晋书讲述的是晋朝时的故事,所以司马较多出现
3.史书词汇可视化总结分析
单词中之,曰,也,为,而,已体现出古人语言的精炼简洁。多词中的司马,皇帝,将军较多说明故事中主人公身份地位较高,在晋朝发生
4.词云可视化的优点与不足
不能全面反映书本信息,但更加便捷
-
2024-12-16 15:15:14@
小组选择史书:《汉书》
数据分析小组:郭思言 张洵洋
所选择史书简介:《汉书》,又称《前汉书》,是中国第一部纪传体断代史,“二十四史”之一。由汉朝东汉时期史学家班固编撰,前后历时二十余年,于建初年中基本修成,后唐朝颜师古为之释注。其中《汉书》八表由班固之妹班昭补写而成,《汉书》天文志由班固弟子马续补写而成。
1.单字词汇可视化
(1)单字词云图及词频统计
-
2024-12-16 15:14:01@
小组选择史书:元史####
数据分析小组:鹿洛语 所选史书简介: 小组选择史书:元史 《元史》是系统记载元朝兴亡过程的一部纪传体断代史,成书于明朝初年,由宋濂(1310~1381年)、王祎(1321~1373年)主编。全书二百一十卷,包括本纪四十七卷、志五十八卷、表八卷、列传九十七卷,记述了从蒙古族兴《元史》,中国“二十四史”之一,记载元朝中国历史事件的一部史书。采用纪传体断代史,成书于1370年。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析: 之,为 曰等字出现的最多,可能与当时的语言风格有关,多以人物叙述
2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析 一员,行省,至元出现的最多,可能与元朝出现行省制有关
3.史书词汇可视化总结分析 元史种“行省”一词出现较多,体现出当时行省制度在全国得到推行,“之,曰”等字体现了其语言简练,可能多以人物叙述为主
4.词云可视化的优点与不足 优点:形象直观,可以直接看出出现次数最多的词语 缺点:不能全部显示词语的出现次数
-
2024-12-16 15:13:39@
-
2024-12-16 15:10:18@
小组选择史书:《旧五代史》
数据分析小组:张健,尹施钰承
所选择史书简介:
《旧五代史》,"二十四史"之一。成书于北宋,原名是《五代史》,也称《梁唐晋汉周书》。是由宋太祖诏令编纂的官修史书。薛居正监修,卢多逊、扈蒙、张澹、刘兼、李穆、李九龄等同修。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析
“之”“为”“以”在该书中使用较多,也反映了中国文言文的语言特点,“之”常常作为代词等出现,“为”常常以动词的形式被使用,“以”则常用作介词等。此外,即使是在未去出单字的统计结果中“节度使”的词频也位于前列。
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析
“节度使”“刺史”“太祖”在本书的多字词汇使用中位居前列,一定程度上也反映了本书写作期间的时代背景。
3.史书词汇可视化总结分析
史书中出现的单字(如:的,于,为等)现在依旧在使用,但多字词汇(如:节度使,太祖等)除在历史相关书籍外很少见到,可见史书对现代文学有一定影响。
4.词云可视化的优点与不足
从多次进行程序运行的结果来看,每一次的分析都有一定的出入和不同,由此可见词云可视化具有一定的系统误差。其次,词云可视化在没有删去无关词汇之前具有相当大的误导性,多了很多口语词汇,并不能反映该史书的特点。最后,词云可视化只是借助该史书词汇的词频进行分析,所以并不能完全反映史书的特点与其时代的特点,具有一定的局限性。
-
2024-12-16 15:10:07@
小组选择史书:《旧五代史》
数据分析小组:张健,尹施钰承
所选择史书简介:
《旧五代史》,"二十四史"之一。成书于北宋,原名是《五代史》,也称《梁唐晋汉周书》。是由宋太祖诏令编纂的官修史书。薛居正监修,卢多逊、扈蒙、张澹、刘兼、李穆、李九龄等同修。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析
“之”“为”“以”在该书中使用较多,也反映了中国文言文的语言特点,“之”常常作为代词等出现,“为”常常以动词的形式被使用,“以”则常用作介词等。此外,即使是在未去出单字的统计结果中“节度使”的词频也位于前列。
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析
“节度使”“刺史”“太祖”在本书的多字词汇使用中位居前列,一定程度上也反映了本书写作期间的时代背景。
3.史书词汇可视化总结分析
史书中出现的单字(如:的,于,为等)现在依旧在使用,但多字词汇(如:节度使,太祖等)除在历史相关书籍外很少见到,可见史书对现代文学有一定影响。
4.词云可视化的优点与不足
从多次进行程序运行的结果来看,每一次的分析都有一定的出入和不同,由此可见词云可视化具有一定的系统误差。其次,词云可视化在没有删去无关词汇之前具有相当大的误导性,多了很多口语词汇,并不能反映该史书的特点。最后,词云可视化只是借助该史书词汇的词频进行分析,所以并不能完全反映史书的特点与其时代的特点,具有一定的局限性。
-
2024-12-15 14:56:52@
### 小组选择史书:《汉书》
**数据分析小组:**宿颖,李丽钱
####**** 所选择史书简介:**** 《汉书》,又称《前汉书》,是中国第一部纪传体断代史,二十四史之一。与《史记》《东观汉记》并称“三史”,又与《史记》《后汉书》《三国志》并称“前四史”。由东汉史学家班固所撰,汉建初年间编成,历二十余年。《汉书》八表由班固妹妹班昭补写,《汉书》天文志由班昭弟子马续补写。唐代颜师古为之作注。为唐代科举之常科。 《汉书》所记载的内容以西汉(含王莽)一朝为主。记录了从汉高祖元年(前206年)至新朝王莽地皇四年(23年)共230年的历史。有纪十二篇,表八篇,志十篇,传七十篇,共一百篇,后人划分为一百二十卷,全书近八十万字。
** #### 1.单字词汇可视化
(1)单字词云图及词频统计**
(2)单字我们小组的发现与分析
“之,曰,也,为,而”出现最多。 “之”“也”“而”都是虚词,“之”字在文言文中多用为代词和助词,“也”常用于表示语气,“而”用于表示并列,承接,转折,修饰,递进,假设等关系;“为”和“曰”常作动词 ####** 2.多字词汇可视化
(1)多字词云图及词频统计**
(2)多字我们小组的发现与分析
“天下”“诸侯”“太子””将军““匈奴”等词语最多, 都为名词。《汉书》记录历史,记录一些战争和诸侯国,因此官名“将军”一词常出现。推测当时匈奴经常进犯。
3.史书词汇可视化总结分析
可以推测本书多以记叙为主,有人物对话。 可以反映出汉朝实行世袭制,分封制,有战争发生,主要抵御的外族是匈奴。
4.词云可视化的优点与不足
(结合你所选择的史书词云图进行分析) 优点:直观,便捷反应数据特点 缺点:不能精准筛选信息,不够全面体现数据,内容不够具体
👍 1 -
2024-12-15 12:07:46@
小组选择史书:《北史》
数据分析小组:陈孟峤、赵籽鑫
所选择史书简介:
《北史》作者李延寿。其所载上起北魏登国元年(386年),下迄隋义宁二年(618年),记北朝北魏、西魏、东魏、北周、北齐及隋六代二百三十三年史事。《北史》思想价值突出,尤其是宣扬“天下一家”的思想:改变了长期以来南方与北方互称“岛夷”与“索虏”的陋习。李延寿把北魏以前北方一些少数政权的历史“编之四夷”。他在撰写中,给南北朝各政权以同样的地位。这种打破南、北对立和华、夷界限的认识和做法,反映了民族融合的伟大成果,是历史的进步。《北史》主要在魏、齐、周、隋四书基础上删订改编而成,但也参考了当时所见各种杂史,增补了不少材料。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析: “之”、“曰”、“为”、“也”、“与”、“以”等这类虚词占比最大。由此反映出了文言虚词常用性与连接性。(文言虚词包括 代词、副词、介词、连词、助词、叹词等,一般是指不作句子成分,不表示实在的意义的词。)
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析: 除了“以为”、“于是”等这一类连词外,“刺史”、“尚书”、“大将军”这一类表官职称呼的词语占比较大。既可以集中反映史书的普遍特点,又体现了《北史》所独有的自东汉以来政权瓦解到隋唐时期建立三省六部制之间这段过渡时期北方政权更迭的过程、与中原文化的交融、以及政治制度进程完善。
3.史书词汇可视化总结分析
不难发现,表示官职称谓、皇族、皇帝年号等词在《北史》中高频出现。查找资料可得:由于传统观念的影响和一家一姓的皇朝史格局的束缚,南北朝各史都或多或少地带有消极的历史影响。在新的统一(唐)的历史条件下,用“天下一家”的思想重新撰述分裂时期的历史,这不仅是当时政话上的需要,而且对整个国家和民族在精神财富的建设与积累方面具有重要意义。
4.词云可视化的优点与不足
优点:简洁直观、通过数据处理集中反映词频趋势、便于提取关键信息与分析总结。 缺点:虚词出现频率最高,不能很好的筛除;不能具体、详尽的总结数据以及集中反映时代特点,仍然需要人为总结。
-
2024-12-14 19:50:20@
选择史书:北史 小组成员:14组 吴佳霖 钟佳瑜 《北史》是二十四史之一,是汇合并删节记载北朝历史的《魏书》、《北齐书》、《周书》、《隋书》而编成的纪传体史书。魏本纪五卷、齐本纪三卷、周本纪二卷、隋本纪二卷、列传八十八卷,共一百卷。记述从北魏登国元年(386年(丙戌年))到隋义宁二年(618年)的历史。《南史》与《北史》为姊妹篇,是由李大师及其子李延寿两代人编撰完成的。《北史》包括本纪12卷,列传88卷,共计100卷,所记历史自北魏道武帝建国开始(公元386年),直到隋恭帝义宁二年(公元618年)结束,共计233年。书中主要记载了北魏、东魏、西魏、北齐、北周、隋这几个朝代的兴衰。《北史》的12卷本纪包括:魏本纪5卷、齐本纪3卷、周本纪2卷、隋本纪2卷。另外,在记载北魏分裂后的历史时,尊东魏为正统,对西魏历史记载很少。 《北史》的很多史料印证和补充了《魏书》《北齐书》《周书》《隋书》的不足,具有很大的价值。
-
2024-12-12 12:50:55@
小组选择史书:元史 《元史》是系统记载元朝兴亡过程的一部纪传体断代史,成书于明朝初年,由宋濂(1310~1381年)、王祎(1321~1373年)主编。全书二百一十卷,包括本纪四十七卷、志五十八卷、表八卷、列传九十七卷,记述了从蒙古族兴《元史》,中国“二十四史”之一,记载元朝中国历史事件的一部史书。采用纪传体断代史,成书于1370年。宋濂(1310-1381)、王袆(1321-1373)遵照皇帝朱元璋的诏令,主持编修。全书共210卷,包括本纪47卷、志58卷、表8卷、列传97卷。《元史》中的本纪,以记载元世祖忽必烈生平事迹的《世祖本纪》最为详尽,内容有14卷之多,约占本纪篇幅的30%;《元史》的志书,对元朝的典章制度做了详细记述,保存了大批珍贵的史料;《元史》列传的写法大多沿袭以往的史书,只有《释老》一传是《元史》的创新。《释老》是记载宗教方面的列传,从中可以了解宗教在元朝的地位和发展情况。 [5]明修《元史》体例整齐,文字浅显,内容多照抄史料,所以保存了大量原始资料,使它具有较高的史料价值。但明修《元史》由于编修时间仓促,且多采用墓志、神道碑、家传、行述等现成史料堆砌,再加上没有给史官和编纂者预留充足的时间勘误,
-
2024-12-11 12:51:51@
小组选择史书:《周书》 数据分析小组:姜泉伶 所选择史书简介: 《周书》是中国历代正史之一,是北周(557年—581年)的纪传体史书。该书由唐朝的令狐德棻主编,参与编写的还有岑文本和崔仁师等人,成书于唐贞观十年(636年),共50卷,包括本纪8卷和列传42卷。
1.单字词汇可视化 (1)单字词云图及词频统计
(2)单字我们小组的发现与分析 出现最多的单字词汇是之,反映古汉语中之这一类词汇为常用语
2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析 刺史等官职名称出现较多,周时官职变动多
3.史书词汇可视化总结分析 事件发动者或参与者多为地方官吏,书中多次提到太祖等词证明周人对先人的尊敬,称先人称庙号也是史书书写一大特点
-
2024-12-11 11:28:50@
小组选择史书:《陈书》
数据分析小组:揭方涵奕 戴之哲
所选择史书简介:
《陈书》是唐朝人姚思廉所著的史学作品,属二十四史之一,是一本纪传体史类书,凡三十六卷,记载南朝陈朝史。成书于贞观十年(公元636年)。《陈书》描画了陈朝社会历史全图,是现在人研究陈朝历史的第一手资料,具有重要的史学价值。在文风上,《陈书》一改六朝颓靡文风。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析
之 而 为 与 以 反映了当时文言文以记事为主,多对话,多结构助词与语气词。
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析
词语多为“高祖 太守 高宗 世祖” 都是官职名,反映了当时的语言环境,增强了文章的文学表现力,具有文学价值,反映当时的政治背景。
3.史书词汇可视化总结分析 史书词汇可视化增强了理解与记忆,发现新的知识和规律,可以从不同的角度观察和分析历史信息,激发阅读者的兴趣。
4.词云可视化的优点与不足 优点:便于直观了解书中的词语(关键词),大致了解书中的内容,突出重要信息,便于快速浏览。
不足:解读具有主观性,忽略低频词,导致信息不完整。
-
2024-12-11 11:28:40@
小组选择史书:《史记》 数据分析小组:陈禹霏,欧阳子晨 所选择史书简介: 《史记》是中国第一部纪传体通史,由司马迁撰写,记载了从黄帝时代到汉武帝时期约三千年的历史。它以纪传体的形式,全面系统地展现了中国古代的历史面貌,包括政治、经济、文化、思想等各个方面。
1.单字词汇可视化 (1)单字词云图及词频统计
(2)单字我们小组的发现与分析
(词频出现最多单字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点)
2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析
(词频出现最多多字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点)
3.史书词汇可视化总结分析 (结合单字到多字变化,以及常用词语和史书所反映时代,进行分析)
-
2024-12-11 11:28:24@
-
2024-12-11 11:27:18@
小组选择史书:《史记·陈书》 数据分析小组:陈禹霏 欧阳子晨 所选择史书简介: 《陈书》是唐朝人姚思廉所著的史学作品,属二十四史之一,是一本纪传体史类书,凡三十六卷,记载南朝陈朝史。成书于贞观十年(公元636年)。 《陈书》是姚思廉继承其父姚察的遗志,奉唐太宗之命编写而成的。 《陈书》的内容主要是取自姚察所写南朝陈史的资料,也融汇了他人所作的史料。 《陈书》中包括本纪6卷、列传30卷,共36卷,所记历史自南朝陈霸先建国(公元557年)开始,直到隋灭陈(公元589年)结束,共计33年。其中,6卷本纪中共记载了南朝陈的5位皇帝,其中陈武帝2卷,其他4帝则是每帝各1卷;30卷列传分为《王子传》《皇后传》《宗室传》《诸臣传》《儒林传》《文学传》《孝行传》,共计7类。 《陈书》比较翔实地记载了有关南朝陈的历史,但是,书中也存在很多避讳和溢美的言辞,使很多有关历史的记载存在失实之处。 《陈书》一书由于内容存在为统治阶级歌功颂德的地方,因此史学界历来对它的评价不高。
1.单字词汇可视化 (1)单字词云图及词频统计
(2)单字我们小组的发现与分析
(词频出现最多单字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点) 之 为 而 与,因为史记所采用的是文言文,文言文中的语言习惯就是这些虚词,同时还有战更多,这或许体现出了当时战争较多 2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析 高祖 将军 刺史 太守 尚书,这或许因为当时的陈家出了许多的将军?刺史?尚书?这体现出其文言文的风格 (词频出现最多多字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点)
3.史书词汇可视化总结分析 (结合单字到多字变化,以及常用词语和史书所反映时代,进行分析) 文言文风格明显,“战”官职的数量较多,说明当时的政治格局较不稳定,各国间纷争不断,出现了各种大大小小的局部或全面战争
-
2024-12-11 11:27:10@
小组选择史书:《史记》
数据分析小组:罗维博 刘紫露 姚景然
所选择史书简介:
《史记》是中国第一部纪传体通史,由司马迁撰写,记载了从黄帝时代到汉武帝时期约三千年的历史。它以纪传体的形式,全面系统地展现了中国古代的历史面貌,包括政治、经济、文化、思想等各个方面。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析 (词频出现最多单字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点 答:“之”“曰”等字词最多。反映它偏向于判断语气,议论性强。
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析 词频出现最多多字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点 答:“天下”“诸侯”“太子”最多。反映当时天子为尊,诸侯争霸的时代背景,真实客观,条理清晰。 3.史书词汇可视化总结分析 答:古文风格明显,多以真实记录史实为主。政治局面混乱,纷争不断。 4.词云可视化的优点与不足 (结合你所选择的史书词云图进行分析) 答:缺点:区分度不足。对于词频相差较大的词汇有较好的区分度,但对于出现频率差不多的词汇的区分效果不是很好。 优点:视觉上更有冲击力。词云图比条形图、直方图和词频统计表格等更有吸引力,视觉冲击力更强。
-
2024-12-11 11:27:09@
小组选择史书:《金史》 数据分析小组:袁子越 所选择史书简介:《金史》是二十四史之一,记载了金朝的兴衰始末,由元代的脱脱等人编撰而成,全书共135卷。其中,本纪19卷、志39卷、表4卷、列传73卷,书末另附有《金国语解》1卷 1.单字词汇可视化
-
2024-12-11 11:26:30@
小组选择史书:《新五代史》
数据分析小组:董昊轩 殷若鸣
所选择史书简介:
《史记》是中国第一部纪传体通史,由司马迁撰写,记载了从黄帝时代到汉武帝时期约三千年的历史。它以纪传体的形式,全面系统地展现了中国古代的历史面貌,包括政治、经济、文化、思想等各个方面。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析 之 因为表意丰富 1.表示了领属关系:如 “燕王,吾所立,契丹与吾约为兄弟,而皆背晋以归梁。此三者,吾遗恨也。与尔三矢,尔其无忘乃父之志”,其中的 “乃父之志” 通过 “之” 字明确了是 “你的父亲的志向”,这种领属关系的表达,使人物之间的关系和情感传递更加清晰准确.2.体现时间、范围等限制:如 “当此之时,臣弑其君,子弑其父,而缙绅之士安其禄而立其朝,充然无复廉耻之色者皆是也” 中的 “之”,限定了 “时” 的范围,强调了在特定的五代时期这一背景下,所描述的种种乱象,突出了时代的特征和作者对该时代的批判态度.
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析 太祖 王朝兴替频繁:五代时期政权更迭频繁,“太祖” 作为各个王朝的开创者,其频繁出现凸显了这一时期的动荡不安与政治格局的快速变化。例如,朱温建立后梁,开启了五代的第一个中原王朝,而随后的后唐、后晋、后汉、后周也都有各自的太祖,他们各自通过不同的方式建立政权,反映了当时武力征伐、势力角逐的时代特点. 正统性的强调:在封建时代,开国皇帝被尊称为 “太祖” 等庙号,体现了对其政权正统性的追认和强调。《新五代史》中对各位太祖的记载,从一定程度上反映了当时社会对于王朝合法性的认知和构建。这些太祖们通过军事力量、政治手段等建立新的王朝,而史书对他们的记载和称呼则是对其统治地位的一种确认,有助于巩固新政权在历史叙述中的正统性.
3.史书词汇可视化总结分析
频繁的王朝更替 在五代时期,中原地区先后经历了后梁、后唐、后晋、后汉和后周五个朝代。《新五代史》通过详细记载各个朝代的兴衰,展现了这种走马灯式的政权交替。例如,后梁是朱温篡唐建立的政权,然而其统治并不稳固。朱温死后,诸子争立,内部矛盾重重,最终被后唐所灭。后唐庄宗李存勖以武力统一北方大部分地区,但他后期荒淫无道,导致政治腐败,在兵变中被杀,后唐也走向衰落。 这些王朝的更替反映了当时武人专权的局面。由于军事将领手握重兵,他们往往凭借武力夺取政权。在这种背景下,忠诚观念淡薄,皇位成为各方势力争夺的目标,使得中原地区长期处于动荡不安的状态。 割据局面的复杂 除了中原的五代政权,周边还有十个相对独立的割据政权,被称为 “十国”。《新五代史》也涉及到这些割据政权与中原王朝的关系。例如,南唐在南方是一个较为强大的政权,它在文化、经济等方面有一定的发展。南唐中主李璟和后主李煜时期,虽然在政治上对中原王朝称臣,但也试图维持自身的独立性。 这种割据局面导致了各地在政治、经济、文化等方面的差异进一步加大。各个割据政权为了生存和发展,采取了不同的政策,有的注重发展商业,有的则加强军事防御,整个中国处于一种分裂和多元的状态。
4.词云可视化的优点与不足
优点: 直观呈现关键词:能够快速且直观地展示文本中的主要关键词,让用户一眼就能把握文本的核心内容和重点信息,节省了阅读大量文本的时间. 突出重要信息:通过字体大小、颜色等方式突出显示高频关键词,强调了文本中不同词汇的重要性,有助于用户快速聚焦于关键信息,发现文本中的核心议题. 数据压缩与概括:可以将大量的文本信息压缩成一张简洁的图形,便于快速浏览和理解,尤其适用于处理大规模文本数据,帮助用户在短时间内获取文本的整体概况. 美观且吸引力强:词云图可以设计成各种形状和颜色,具有较高的艺术性和观赏性,视觉效果出色,能够吸引观众的注意力,增强数据展示的趣味性和感染力,使数据更易于被接受和传播. 应用场景广泛:适用于多种领域和场景,如市场调研、舆情分析、用户画像、学术研究、新闻报道等,可以帮助分析人员快速了解文本数据的特征和趋势,发现潜在的信息和规律. 交互性强:部分词云工具支持交互操作,用户可以点击词云中的单词获取更多详细信息或执行搜索,进一步深入探索文本数据,增强了用户与数据之间的互动性. 低创作门槛:制作词云图的难度相对较低,不需要专业的编程或设计技能,借助各种在线工具或简单的软件,即使没有数据处理技术的人也能轻松制作出具有一定效果的词云图. 缺点: 区分度有限:对于词频相近或颜色相近的词汇,词云图难以有效区分其重要性或差异,可能导致信息的混淆和误解,尤其在处理数据区分度不大的文本时,这种局限性更为明显. 信息完整性不足:词云图主要突出显示高频词汇,而大量的低频词或长尾词则可能被忽略或难以清晰呈现,这可能导致部分有价值的信息丢失,无法全面反映文本的完整语义和细节内容. 缺乏精确性:词云图只是对文本数据的一种概括性可视化表示,无法像表格或详细的统计图表那样精确地展示数据的具体数值和比例关系,对于需要精确数据分析的场景可能不够适用。 受分词技术等影响:生成词云图的过程中,分词技术、算法以及词库质量等因素会对结果产生较大影响。不同的分词方式或词库可能导致关键词的提取不准确,进而影响词云图的准确性和可靠性,甚至可能出现乱码等问题. 解读主观性较强:词云图的解读在一定程度上依赖于用户的主观认知和理解,不同的人对同一词云图可能会有不同的解读和侧重点,缺乏明确统一的解读标准,容易产生歧义或过度解读的情况.
-
2024-12-11 11:26:17@
### 小组选择史书:《后汉书》
数据分析小组:乔楚涵 黎熠斐
所选择史书简介: 《后汉书》是一部由南朝宋时期历史学家范晔编撰的纪传体史书,记载了东汉一朝的历史。
1.单字词汇可视化 (1)单字词云图及词频统计
(2)单字我们小组的发现与分析 “之” “曰” “为” 文体为文言文,语气,结构运用这些做助词 语气助词偏多,议论性强。
2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析 “太守” “将军” “以为” “天下” 历史性书籍,官名较多,时人心系天下 简洁明了,真实客观,结构严谨。
3.史书词汇可视化总结分析 骈散相结合,东汉时期动乱,时人心系天下,关心时政。
4.词云可视化的优点与不足 优点:视觉冲击力强,直观展示重点,信息高度浓缩,应用场景广泛。从《后汉书》中直观感受文言文单字和多字的魅力以及与现代文的不同。 缺点:区分度有限,信息完整性不足,缺乏统一标准,难以展示复杂关系。在《后汉书》中无法真正完整地展现出我们想统计的多字例如“所以”,“以为”等多字。
-
2024-12-11 11:25:17@
小组选择史书:《三国志》
数据分析小组:高彦梅,卢嘉瑞
所选择史书简介:《三国志》是晋代陈寿编写的一部主要记载魏、蜀、吴三国鼎立时期的纪传体国别史。 《三国志》全书六十五卷,魏书三十卷,蜀书十五卷,吴书二十卷。陈寿是晋朝朝臣晋承魏而得天下,所以三国志尊魏为正统。三国志为曹操写了本纪,而蜀书和吴书则记刘。三国志内容是什么综合百科1万阅读投稿:admin《三国志》是晋代陈寿编写的一部主要记载魏,蜀,吴三国鼎立时期的纪传体国别史。详细记载了从魏文帝黄初元年220到晋武帝太康元年280,六十年的历史。三国志为曹操写了本纪,而蜀书和吴书则记刘备为先主传,记孙权称吴主传,均只有传没有纪。《三国志》不仅是一部史学巨著,更是一部文学巨著。
1.单字词汇可视化 (1)单字词云图及词频统计
(2)单字我们小组的发现与分析 之,而,也,为等词用的多,是古代的助词,连接词,语气词。
2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析
将军,太祖等多字中出现最多的是人名称谓一类名词,其次是一系列动词实词。反映出当时战争频发,涌现出如诸葛亮等杰出的谋士与将领。
3.史书词汇可视化总结分析
虚词动词名词等使用较多,且较为单一。
4.词云可视化的优点与不足
不足:没把标点收集统计,无法准确地反映字词出现频率,无法反映所分析非文本的特点。 优点:较为直观反映字词出现频率。直接反映出文本关键词,反映出书本特点。
-
2024-12-11 11:24:36@
小组选择史书:《梁书》
数据分析小组:明阳 石浩君
所选择史书简介:
《梁书》是二十四史之一,是唐初姚察、姚思廉撰纪传体史书。包含本纪六卷、列传五十卷,无表、无志。它主要记述了南朝萧齐末年的政治和萧梁皇朝(公元502年—557年)五十余年的史事。其中有二十六卷的后论署为“陈吏部尚书姚察曰”,说明这些卷是出于姚察之手,这几乎占了《梁书》的半数。姚思廉撰《梁书》,除了继承他父亲的遗稿以外,还参考、吸取了梁、陈、隋历朝史家编撰梁史的成果。该书特点之一为引用文以外的部分不以当时流行的骈体文,而以散文书写。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析
词频出现最多单字词汇是:“之”“为” 为什么:“之”的作用有很多,如作为代词助词或用在主谓结构之间,使成为句子成分。“为”可以做判断词,表被动,表动作和行为等,在古文中具有很重要的地位。
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析
词频出现最多多字词汇是:“将军”“刺史”“高祖” 为什么?本书记叙了梁朝历史,主要记载武帝萧衍乘南齐政权衰微之际建立梁朝之事。所以各种职位的词居多。
3.史书词汇可视化总结分析
本书主要记载武帝萧衍乘南齐政权衰微之际建立梁朝之事。该书特点之一为引用文以外的部分不以当时流行的骈体文,而以散文书写。
4.词云可视化的优点与不足
优点:视觉冲击大,直观地反映出词语的数量。 缺点:区分度不足,信息缺失(不能反映出全部信息)
-
2024-12-11 11:24:21@
- 小组选择史书:《辽史》
数据分析小组:刀子然,杨芮源
所选择史书简介:
《辽史》为元脱脱等人主持编修之纪传体史书,中国历代官修正史“二十四史”之一。由元至正三年(1343年)四月开始修撰,翌年三月成书。脱脱为都总裁,铁木儿塔识、贺惟一、张起岩、欧阳玄、揭傒斯、吕思诚为总裁官,廉惠山海牙等为修史官。
1.单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析
之体现了文本古文的行书特点;宋体现了辽与宋朝交往频繁,历史渊源深厚;曰是说的意思,说明原文引用历史原话较多
2.多字词汇可视化
(1)多字词云图及词频统计
(2)多字我们小组的发现与分析
遣史,节度使等出现较多,反映辽的外交频繁,以节度使制为主;耶律出现多,可能是辽的重要人物或姓氏(皇室成员的姓氏);有南京,高丽,渤海等地理名词且跨度大,可能辽的疆域辽阔。
3.史书词汇可视化总结分析
《辽史》这部书中用的文言文虚词较多,反映了其属于文言文;双词中描述时间的词占比多,写作时可能较注重时间顺序;“皇后”这类词多,记录时以皇室成员,朝廷大事为主(可能民间文化记录少)。
4.词云可视化的优点与不足
优点:
1.可以快速获得整本书的关键词,从而推测大致内容。提高了分析效率:
2.相较于阅读整本书而言,阅读一张词云图更有趣,还会注意到书中速读而省略的信息。
缺点:
1.部分词语没有实际意义还占用了位置,需要挨个排查;
2.相较于阅读整本书而言,单凭词云图不能了解书的线索,写作思路等;
-
2024-12-11 11:23:04@
小组选择史书:《汉书》 数据分析小组:宿颖,李丽钱 所选择史书简介: 《汉书》是中国第一部纪传体断代史,由东汉史学家班固编撰,历时二十余年,于汉建初年完成。全书共一百二十卷,记载了从汉高祖元年(前206年)至新朝王莽地皇四年(23年)共230年的历史。《汉书》包括纪十二篇、表八篇、志十篇、传七十篇,共一百篇,全书近八十万字。
1.单字词汇可视化 (1)单字词云图及词频统计
(2)单字我们小组的发现与分析
(词频出现最多单字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点) 曰,为,而,也,之。因为文言文中常用这几个虚词。内容多对话,风格文言文。 2.多字词汇可视化 (1)多字词云图及词频统计
(2)多字我们小组的发现与分析
(词频出现最多多字词汇是哪些?为什么?这反映了该本书的哪些书写风格以及内容特点)
3.史书词汇可视化总结分析 (结合单字到多字变化,以及常用词语和史书所反映时代,进行分析)
-
2024-12-11 11:23:00@
小组选择史书:《金史》
数据分析小组:谭喆人,李子明
所选择史书简介:
、《金史》是二十四史之一。撰成于元代,全书一百三十五卷,其中本纪十九卷,志三十九卷,表四卷,列传七十三卷,是反映女真族所建金朝的兴衰始末的重要史籍。
分享1:单字词汇可视化
(1)单字词云图及词频统计
(2)单字我们小组的发现与分析:
天文、历、五行、河渠、地理、祭祀、礼乐、舆服、仪卫、选举、百官、兵、刑及食货等词汇多,说明当时职业丰富皇帝更换频繁
分享2:多字词汇可视化
(2)多字词云图及词频统计
(2)多字我们小组的发现与分析:
虚词居多,高祖等皇帝庙号使用得很多“战争”等词使用频繁
分享3.史书词汇可视化总结分析
均体现了金朝是一个文化繁荣,战争频繁的时代
分享4.词云可视化的优点与不足
优点:一、信息突出与快速理解
直观简洁 二、视觉吸引力 引人关注 增强记忆 三、高效的数据分析辅助工具 数据探索开端 对比分析有效 缺点:无法展示事件所有信息
- 1