中国历代人物传记资料库(CBDB)是在社会学科领域有着鼎鼎大名,它系统性地收入了中国历史上所有重要的传记资料,其项目主页地址如下: https://projects.iq.harvard.edu/chinesecbdb 页面功能概括如下:只需要输入一个历史人物名(CBDB 共收录 52w 余人),就能生成该人物的社会关系图、亲属关系图以及此人在华夏大地留下的足迹图。
前阵子发布的 CBDB | 可视化历史名人的关系和足迹,能够生成历史名人的关系图和足迹图,我在文中举了苏轼的例子,相信读者都多多少少对李白、杜甫、苏轼的生平有所了解,但是当我将几个名气不如以上三位的一些诗人足迹图发到交流群中时
简介 Cloudberry Database(可简称为“CBDB”或“CloudberryDB”)是面向分析和 AI 场景打造的下一代统一型开源数据库,搭载了 PostgreSQL 14.4 内核,兼容
第二点则稍微费事一点,我们使用哈佛大学编纂的《中国历代人物专辑资料库》(China Biographical Database Project 以下简称CBDB),CBDB记录了中国历代名人的传记资料, 1 利用CBDB查找诗人的别名 CBDB由很多张表组成,每张表记录了人物的不同信息,我们只用到了其中两张表,人物的主要信息表:BIOG_MAIN和人物的别名表:ALTNAME_DATA 首先从BIOG_MAIN 中查询出人物编号c_personid,接着用c_personid从ALTNAME_DATA中查询出别名,如下图所示: 下面我给大家演示一下如何从CBDB中查询杜甫的别称。 由于CBDB收罗的历史人物太多,重名现象非常严重。经过一番探索,最终设置了如下的排除重名策略: 1.如果人物生卒年俱全,那么只要生卒区间和唐朝持续时间有交集即可。 经过这三条判断之后: 如果候选人列表为空,那么说明CBDB中没有目标人选,舍弃这位诗人。 如果候选人多于一个,则说明排除重名失败,舍弃这位诗人。 这种策略并不完美,存在部分注明诗人被舍弃的情况。
如下获取了苏轼的基本信息: 数据来源:CBDB 如下获得了李白的别名资料: 可以单个查询,也可以批量: 如果是单个查询,可以如下Power Query新建公式: Json.Document(Web.Contents ("https://cbdb.fas.harvard.edu/cbdbapi/person.php?
第二点则稍微费事一点,我们使用哈佛大学编纂的《中国历代人物专辑资料库》(China Biographical Database Project 以下简称CBDB),CBDB记录了中国历代名人的传记资料, 1 利用CBDB查找诗人的别名 CBDB由很多张表组成,每张表记录了人物的不同信息,我们只用到了其中两张表,人物的主要信息表:BIOG_MAIN和人物的别名表:ALTNAME_DATA 首先从BIOG_MAIN 中查询出人物编号c_personid,接着用c_personid从ALTNAME_DATA中查询出别名,如下图所示: 下面我给大家演示一下如何从CBDB中查询杜甫的别称。 由于CBDB收罗的历史人物太多,重名现象非常严重。经过一番探索,最终设置了如下的排除重名策略: 如果人物生卒年俱全,那么只要生卒区间和唐朝持续时间有交集即可。 经过这三条判断之后: 如果候选人列表为空,那么说明CBDB中没有目标人选,舍弃这位诗人。 如果候选人多于一个,则说明排除重名失败,舍弃这位诗人。 这种策略并不完美,存在部分注明诗人被舍弃的情况。
第二点则稍微费事一点,我们使用哈佛大学编纂的《中国历代人物专辑资料库》(China Biographical Database Project 以下简称CBDB),CBDB记录了中国历代名人的传记资料, 1 利用CBDB查找诗人的别名 CBDB由很多张表组成,每张表记录了人物的不同信息,我们只用到了其中两张表,人物的主要信息表:BIOG_MAIN和人物的别名表:ALTNAME_DATA 首先从BIOG_MAIN 中查询出人物编号c_personid,接着用c_personid从ALTNAME_DATA中查询出别名,如下图所示: 下面我给大家演示一下如何从CBDB中查询杜甫的别称。 由于CBDB收罗的历史人物太多,重名现象非常严重。经过一番探索,最终设置了如下的排除重名策略: 1.如果人物生卒年俱全,那么只要生卒区间和唐朝持续时间有交集即可。 经过这三条判断之后: 如果候选人列表为空,那么说明CBDB中没有目标人选,舍弃这位诗人。 如果候选人多于一个,则说明排除重名失败,舍弃这位诗人。 这种策略并不完美,存在部分注明诗人被舍弃的情况。
一直想用更加可视化的手法来验证这个观点,图表总是比理论直观生动的第一步就难到我了,首先得有全世界人的关系网,这不现实,所以我只能利用去年做过一些文章的中国古代历史人物传记数据集,CBDB。 1、CBDB | 可视化历史名人的关系和足迹,https://cloud.tencent.com/developer/article/22752492、定量分析通过苏轼最多能联系到多少人? ,https://cloud.tencent.com/developer/article/2443050CBDB 人物和关系数据量非常庞大,为了具象化这个大,可以查看下面这个视频,我只抽取出了宋朝这一个朝代
out = new ObjectOutputStream(bOut); out.writeObject(cbdb key.channel(); ByteArrayInputStream bIn; ObjectInputStream in; CBaseDataBean cbdb ByteArrayInputStream(bbObj.array()); in = new ObjectInputStream(bIn); cbdb = (CBaseDataBean) in.readObject(); switch (cbdb.getDataType()) { ; case CMsgTypeBean.MSG_TYPE_SENDFILE: rcv_msg_sendfile(cbdb
CBDB Migration VisX 简单说,它是一个数字人文方向的数据可视化网站,专门围绕历代官员群体来做。我给它起名叫 CBDB Migration VisX。部署到了清凉云。 数据来源说明 底层数据用的是中国历代人物传记资料库,即 CBDB,哈佛大学和北京大学等机构联合维护的一个中国古代传记数据库,这个数据库,从查阅到勘误,从补充到更正,学界下了很多年的功夫。
out = new ObjectOutputStream(bOut); out.writeObject(cbdb key.channel(); ByteArrayInputStream bIn; ObjectInputStream in; CBaseDataBean cbdb ByteArrayInputStream(bbObj.array()); in = new ObjectInputStream(bIn); cbdb = (CBaseDataBean) in.readObject(); switch (cbdb.getDataType()) { ; case CMsgTypeBean.MSG_TYPE_SENDFILE: rcv_msg_sendfile(cbdb
最后一位上台演讲的嘉宾是来自北京大学中古史中心的博士生胡斌,他的演讲主题是《中国历代人物传记资料库(CBDB)的建设与使用》。 ? 演讲伊始,他介绍了 CBDB 基本状况,这是一个关系型数据库,涵盖多个不同实体,如人名、时间、地址、著作、亲属关系、社会关系等。他表示,在关系型数据库中,人物的数据资料存在于各种实体的互动之中。 大家可以点击 https://projects.iq.harvard.edu/cbdb 访问该数据库。 CBDB 现今包含 417382 人的数据,质量比较高的是唐宋数据。 接下来,他提到利用 CBDB 的一些应用,以下是利用该数据集可以做的三种分析: 一是群体分析、统计分析,相关案例有统计 CBDB 数据集中 32270 人的死亡年龄,统计 CBDB 资料中 3119 名女性的死亡年龄
pdcsi-node-n785g evicting pod kube-system/kube-dns-697dc8fc8b-n5vh8 evicting pod kube-system/konnectivity-agent-7cbdb6d67d-jdjmp pod/konnectivity-agent-7cbdb6d67d-jdjmp evicted pod/kube-dns-697dc8fc8b-n5vh8 evicted node/gke-ssli-demo-default-pool
3045022100e4a4695ecbe6f507ec7181a2f321f489c7a3bd7eea032c75e4e1eba89174183c022019555aa917be6191db14da72e5c234a4b628f321b917ea334bcf9c122296cd5901] [044da006f958beba78ec54443df4a3f52237253f7ae8cbdb17dccf3feaa57f3126da0a0909f11998130c2d0e86a485f4e79ee466a183a476c432c68758ab9e630b return ConvertPKHToAddress(b'\x00', pubkey_hash) pubkey = "044da006f958beba78ec54443df4a3f52237253f7ae8cbdb17dccf3feaa57f3126da0a0909f11998130c2d0e86a485f4e79ee466a183a476c432c68758ab9e630b
因此,开始分析其中一个加载器样本(MD5 b29089669c444cbdb62d89bf0e3c9ef8)。 成功脱壳后,我们应该来到了地址4040C7入口点: ?
数据来源说明底层数据用的是中国历代人物传记资料库,即CBDB,哈佛大学和北京大学等机构联合维护的一个中国古代传记数据库,这个数据库,从查阅到勘误,从补充到更正,学界下了很多年的功夫。
7201eddc3a4c: Pull complete 384b637b5031: Pull complete e878247dc643: Pull complete Digest: sha256:5b99cbdb905610eb1aa47c24c15b724045e65dab0b5fd1c069f5f722895724e9
为了让他们对号入座、不重复、不遗漏,“前进四”使用CBDB(中国历代人物传记资料库,系统性收录中国历代名人传记资料)查询诗人的主要信息及别名,排除年代不符的重名,手动补充遗漏部分。 由于把全唐诗所有诗人关系都理出来会很乱,借助CBDB来的筛选,“前进四”将762位诗人纳入社交网络的关心范围。 范围既定,程序运行。首先,看一下著名的李白与杜甫。
为了让他们对号入座、不重复、不遗漏,“前进四”使用CBDB(中国历代人物传记资料库,系统性收录中国历代名人传记资料)查询诗人的主要信息及别名,排除年代不符的重名,手动补充遗漏部分。 由于把全唐诗所有诗人关系都理出来会很乱,借助CBDB来的筛选,“前进四”将762位诗人纳入社交网络的关心范围。 范围既定,程序运行。首先,看一下著名的李白与杜甫。
30) 04-22 11:12:22.129 8084 8691 F art : art/runtime/java_vm_ext.cc:470] native: #06 pc 0046cbdb