添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
成都信息工程大学孙莎岚教授在报告《关于 < 明画录 > 文本数据的整理》中介绍了基于数据完备、内容系统、体例规整的特点,提取《明画录》作为明代画家人物信息数据挖掘的基础性文本的过程。在这一过程中,充分运用了 CBDB ACCESS 进行人物查找,可更为准备地进行人物消歧;同时结合基本古籍库的衍生文献与 CNKI 、读秀的研究成果以甄别原始文献的错误以及数字化文本的错误。目前已获取 828 位来自《明画录》的画家, 941 条别名信息, 634 条传记地址信息,以及他们之间的 245 条师承社会网络关系,这批画家数据应该是 CBDB 对明代画家最系统的一次补充。在上述数据的基础上,运用 QGIS 分析对比宋明时期的画家聚集趋势,以及运用 GEPHI 分析明朝画家群体的师从关系,从而形成人物社会关系网络的可视化表达,进而从个体研究转向群像研究。 东北师范大学孔凡晶老师以《 CBDB 与哈佛燕京古籍珍善本的关联》为报告题目,介绍了三种方式开展 CBDB 与哈佛燕京古籍珍善本的关联,以补充 CBDB 中近两万条著述记录的作者信息及为 CBDB 收录更多的权威著述信息。“关联”主要从两个角度展开:燕京古籍珍善本作者信息与 CBDB 人物关联、燕京古籍珍善本书目信息与 CBDB 著述关联。具体方法包括: 1 、应用 HOLLIS API 提取古籍书目信息。原理为逐一提取 CBDB 人物主表 BIOG_MAIN 中姓名字段,与图书馆 HOLLIS 馆藏系统中书籍作者名匹配,进而提取匹配成功的书籍名称和 HOLLIS ID ,写入 CBDB 相应的数据表; 2 、利用哈佛燕京书单提取古籍书目信息。原理为设计书单作者名与 CBDB 人物姓名匹配算法,将匹配成功的书目信息,写入 CBDB 相应的数据表; 3 、利用 FUZZYLOOKUP (模糊匹配算法)提取中华书局提供的哈佛燕京古籍书目信息。分别设置书名和作者名的匹配度,按匹配度从高到低排序,并人工消歧。 北京大学黄珊蕙博士在报告《地方志中的数据挖掘与分析——以江西通志中的职官志与驿站为例》中,介绍了职官志数据挖掘和分析,探索性的驿站数据提取、修正和分析以及结论与潜在研究三个部分。首先,黄珊蕙博士介绍利用爱如生与 LoGart 地方志分析平台,处理了雍正版的《江西通志》四十六至四十八章 5100 条从汉代至清代的职官数据,包括姓名、别名、官职、籍贯、入仕等信息。其次以江西通志的邮驿章节作为分析文本,对驿站数据进行提取、修正和分析;最后通过对《江西通志》中的数据挖掘与分析,黄珊蕙博士认为通过混合方法进行补充性分析会是最高效可靠的。而关于在此基础上的潜在研究,则可以考察通过古今地名比较,对铺驿名称进行模糊检索匹配,引入坡度等其他自然要素信息进行拟合,进一步提升精准度。同时可以进行空间网络分析与空间相关性分析,以更好地检验各因子的影响因素程度。 浙江大学俞沁博士以《中国历代人物传记数据库( CBDB )指数年( index year )计算管见》为题目,介绍了中国历代人物传记数据库( CBDB )所首创的“指数年( index year )”时间概念,创造性地以一个估算的具体年份数值替代历史人物模糊的年代范围,借此将更多人物纳入到数据库时间维度的计算之中。指数年被定义为人物生年,或凭借“ 20 条规则”( 20 rules )结合本人及其亲属的重要时间点推算而来的人物生年。“ 20 条规则”基于统计数据库内大量已知确切时间信息归纳而来,其优先级以降序排列,因而具有理论上的可靠性,以此为据编写程序批计算了 26 2 千余个人物的指数年。 对抽取的样本数据结合史料调查的结果证明,应用优先级较低的规则比多次循环利用推算的接果更易出错。因此,存在多种可能的计算路径时,应当尽量选择优先级较高的计算规则以减少误差,并设立核查点,一旦计算结果越过了预设的差值界限便放弃以此数据为依据计算他人时间信息,以遏制错误在数据库中扩散。无论在历史研究还是历史数据库的建设中,时间信息始终是时空分析最重要的尺度。 首都师范大学李杨博士以《基于 CBDB 的基督教来华传教士的数据探索》为题目,首先介绍了关于数据库人物信息,李杨博士认为 CBDB 的主要目标不是做人名辞典,而是做人物关系。因此从人物个体角度看,人物信息可能是不充分的;但从群体角度看,正是名不见经传的传教士群体,还原了更接近于当时历史情境的社会网络,使研究者可以发现那些与我们直觉和惯常认知不同的问题,真正回到历史现场,而不是去不断地重复经典人物信息。其次,由于 CBDB 刚刚开始积累传教士数据,因此对基督教中国这一领域的相关数据平台做了调研,并将之总结成三类:数字图书馆型数据库、叙事导向型数据库、多重关系型数据库。最后在数据应用角度,从数据透视和地理信息可视化方面做出探索。 北京大学康立坤博士以《 < 经义考 > “三礼”数据》为报告题目,介绍《经义考》是一部中国经学文献的专科目录,首录御注、敕撰的经学书籍 3 卷,再录经学文献 27 297 卷。由于其文本体例规范,易于数据挖掘。《经义考》“三礼”部分中有人物传记信息的人物多为名不见经传的士人,对这部分数据的提取有益于补全 CBDB 数据库人物传记数据。在为 CBDB 补全数据之余,通过数据分析还发现了两个有趣的现象。其中,数据来源的结果显示朱彝尊征引最频繁的文献来源是黄虞稷、《闽书》与陆元辅,其中黄虞稷与陆元辅均为朱彝尊在翰林院的同僚,好友,这一数据验证了这一史实。再将数据导入 QGIS 中进行分析,得到了《经义考》“三礼”中有人物传记信息的士人的祖籍排在第一位的为永嘉。朱彝尊于康熙元年曾避难于永嘉,对永嘉颇有感情,曾作有关永嘉诗词六十余首,这一现象或可表明朱彝尊在辑选著作及人物传记信息时的倾向。 cbdb_visiting_scholars_report_session.pdf 420 KB 孙莎岚_关于《明画录》文本数据的整理.pptx 4.35 MB 孔凡晶_CBDB与哈佛燕京古籍珍善本的关联.pptx 17.9 MB 李杨_基于CBDB的基督教来华传教士的数据探索.pptx 4.4 MB