一种中医古籍文献主题段落切分与属性标引系统

    公开(公告)号:CN114861605A

    公开(公告)日:2022-08-05

    申请号:CN202210570602.5

    申请日:2022-05-24

    Abstract: 本发明公开一种中医古籍文献主题段落切分与属性标引系统,包括图书维护模块、原书浏览模块、标题管理模块、图书加工模块、加工后浏览模块、段落管理模块、导入导出模块、标签管理模块,本发明可有机整合中医古籍图文数据,集成中医古籍术语词表、古籍知识维护等功能,结合中医古籍文本的特殊性,对中医古籍进行医理、疾病、症状、证候、治法、方剂、中药、调护等主题段落的切分,对主题段落进行主题标引,形成结构化中医古籍主题知识单元。基于主题段落和属性形成对中医古籍进行知识挖掘、大数据分析的基础数据、知识单元。本发明的技术方案提高了中医古籍文献的加工效率,实现了中医古籍等资源的知识挖掘与高效利用。

    一种基于分布式计算的中医古籍大数据挖掘分析系统

    公开(公告)号:CN114822864A

    公开(公告)日:2022-07-29

    申请号:CN202210572139.8

    申请日:2022-05-25

    Abstract: 本发明公开了一种基于分布式计算的中医古籍大数据挖掘分析系统,包括:数据输入模块、数据加工模块、数据清洗模块、数据挖掘分析模块、数据处理模块。数据输入模块,用于输入中医古籍数据;数据加工模块,用于对中医古籍数据进行分段,获得中医古籍的段落数据;数据清洗模块,用于对段落数据进行标准化处理,获得标准化数据;数据挖掘分析模块,用于对标准化数据的术语词进行特征提取,统计术语词的出现频次;数据处理模块,用于对挖掘分析模块提供可行性支持。该系统在传统古籍数据挖掘的基础上集成了Storm分布式平台,同时融入了各算法可视化模块,通过专业化词表解决了古籍挖掘盲目性以及数据量大时算法运行时间长的问题。

Patent Agency Ranking