-
公开(公告)号:CN110147450A
公开(公告)日:2019-08-20
申请号:CN201910372653.5
申请日:2019-05-06
Applicant: 北京科技大学
IPC: G06F16/36
Abstract: 本发明提供一种知识图谱的知识补全方法及装置,能够解决知识补全过程中存在的负例无意义和1-N关系难以处理的问题。方法包括:确定实体和关系对应的空间向量;根据实体和关系对应的空间向量,计算语义关系,得到实体之间新的关系,补全知识图谱;利用生成式对抗网络随机生成负例,并结合导出的事实三元组训练第一知识表示模型;对得到的事实三元组进行概念分层,随机选择事实三元组同一子概念下的实体构造负例,并结合导出的事实三元组,采用最大间隔方法,训练第二知识表示模型;将第二知识表示模型作为第一知识表示模型的判别器输入,通过对抗生成式网络优化第一知识表示模型,得到用于知识补全的目标知识表示模型。本发明涉及知识工程领域。
-
公开(公告)号:CN110134953A
公开(公告)日:2019-08-16
申请号:CN201910367376.9
申请日:2019-05-05
Applicant: 北京科技大学
IPC: G06F17/27 , G06F16/951
Abstract: 本发明提供了一种基于中医古籍文献的中医命名实体识别方法及系统,用以解决中医命名实体的识别问题。所述方法在获取中医古籍文献语料的基础上进行数据清理,再进行语言模型预训练;通过对语料进行序列标注,形成后续模型的训练集;基于序列标注的模型训练集,将语言模型作为编码层,将神经网络结构作为解码层,训练序列标注模型,从而基于序列标注模型进行中医命名实体识别。本发明结合现有的语言训练模型,如Google提出的语言模型预训练方法bert,基于小样本训练集节省了人工标注的成本,提高了识别效果及准确率,易操作,实现对中医古籍文献,尤其是中医古籍医案的有效和全面利用,为中医领域研究打下了良好的基础。
-
公开(公告)号:CN109215798A
公开(公告)日:2019-01-15
申请号:CN201811174093.4
申请日:2018-10-09
Applicant: 北京科技大学
IPC: G16H50/70
Abstract: 本发明提供一种面向中医古文的知识库构建方法,能够快速构建面向中医古文的知识库,省时省力。所述方法包括:对中医古文语料进行关键词提取获取词频大于预设的词频阈值的实体,形成种子实体词表;根据种子实体词表,筛选出中医古文语料中具有两个及两个以上实体的句子,利用依存句法分析得到实体之间的动词关系,形成种子动词词表;根据种子动词词表,扩充种子实体词表;迭代执行形成种子动词词表和扩充种子实体词表的步骤,直到不能获取到新的实体和动词,形成实体关系三元组;根据得到的种子实体词表进行层次聚类,得到分类后的实体词表,并结合得到的实体关系三元组,构建面向中医古文知识库。本发明涉及知识工程领域。
-
公开(公告)号:CN107122451A
公开(公告)日:2017-09-01
申请号:CN201710281403.1
申请日:2017-04-26
Applicant: 北京科技大学
Abstract: 本发明提供一种法律文书案由分类器的自动构建方法,分类效率高、准确率高。所述方法包括:获取多类案由的法律文书,确定每类案由的测试语料;对每类测试语料去停用词和分词;根据分词结果,确定每类案由的基本关键词;根据分词结果,对每类测试语料进行词向量训练,扩充关键词,根据扩充的关键词和确定的基本关键词,确定每类案由的扩充关键词列表;输入待分类法律文书,对输入的所述待分类法律文书去停用词和分词、并进行词向量训练,根据所述待分类法律文书的词向量训练结果,计算所述待分类法律文书与每类扩充关键词列表的语义相似度总和,取语义相似度总和最大值对应的案由为所述待分类法律文书对应的案由。本发明涉及知识工程技术领域。
-
公开(公告)号:CN110134766B
公开(公告)日:2021-06-25
申请号:CN201910384880.X
申请日:2019-05-09
Applicant: 北京科技大学
IPC: G06F16/33 , G06F40/216 , G06F40/289
Abstract: 本发明的实施例公开一种面向中医古籍文献的分词方法和装置,所述方法包括:对中医领域的古籍文献进行预处理,生成训练语言模型的语料;对所述语料进行训练,生成语言模型;使用所述语言模型对所述古籍文献进行无监督分词,生成初步分词结果;根据词性关系、句式的固定搭配以及语言学知识,对所述初步分词结果进行总结,整理出切分规则,形成规则文件;根据所述规则文件中的规则,对所述初步分词结果进行第一次修正,生成第一次修正结果。
-
公开(公告)号:CN109190113A
公开(公告)日:2019-01-11
申请号:CN201810910004.1
申请日:2018-08-10
Applicant: 北京科技大学
Abstract: 本发明提供一种中医理论典籍的知识图谱构建方法,能够提高构建的知识图谱的准确率。所述方法包括:确定中医理论典籍中的实体词表和动词词表;根据确定的实体词表,对中医理论典籍中的实体进行标注;根据已标注实体的中医理论典籍,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体;根据识别出的中医理论典籍中的实体,利用结合注意力机制的双向门控循环单元神经网络进行关系抽取,获取中医理论典籍中实体之间的关系,形成实体关系表;以实体关系表中的实体为节点集,实体关系表中的关系为边集,构建中医理论典籍的知识图谱。本发明涉及知识工程领域。
-
公开(公告)号:CN110134851B
公开(公告)日:2021-10-15
申请号:CN201910367379.2
申请日:2019-05-05
Applicant: 北京科技大学
IPC: G06F16/953 , G06F16/951 , G06F16/31 , G06F16/332
Abstract: 本发明提供了一种基于领域内网的搜索引擎系统及构建方法,用以解决现有技术无法满足搜索引擎的专业化、个性化需求的问题。所述构建方法,通过爬虫策略抓取原始网络信息数据并存储到构建的大数据存储平台中,再从网络信息数据中抽取资源信息,而后基于临时表的同步机制,将资源信息索引到检索集群中;再基于中文分词组件和领域词表的搜索策略,提高信息检索的速度与精度。本发明的搜索引擎系统及构建方法,基于通用搜索引擎系统的一般框架模式,为面向特定领域的轻量级内网搜索引擎系统的构建开辟了一条新的思路,能够自动获取给定内网网络中的各种信息资源并建立索引,提供搜索服务,具有专业性和较高的搜索效率,同时可灵活应用于各种领域。
-
公开(公告)号:CN110335675B
公开(公告)日:2021-10-01
申请号:CN201910536714.7
申请日:2019-06-20
Applicant: 北京科技大学
Abstract: 本发明提供了一种基于中医知识图库的辨证方法,用以提高对现有中医知识图库的利用及中医理论的信息化、智能化。所述辨证方法根据中医基础理论,以建立的中医知识图库为基础,利用强化学习发现并计算症象到证候的元路径和症象到病因的元路径,再将输入的症象由两类元路径分别对应的证候和病因进行评分,从融合后的最高评分中得到最可能的证候。本发明为中医智能诊断的研究开辟了一条新的思路和方法,同时挖掘和丰富中医理论内涵,促进中医理论的现代化、信息化发展,提高历史经验在临床实践中的指导能力和水平,进而促进中医学科的发展,对于创新和深化中医诊疗服务有着重大的现实意义。
-
公开(公告)号:CN109190113B
公开(公告)日:2021-08-31
申请号:CN201810910004.1
申请日:2018-08-10
Applicant: 北京科技大学
IPC: G06F16/36 , G06F16/35 , G06F40/295 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种中医理论典籍的知识图谱构建方法,能够提高构建的知识图谱的准确率。所述方法包括:确定中医理论典籍中的实体词表和动词词表;根据确定的实体词表,对中医理论典籍中的实体进行标注;根据已标注实体的中医理论典籍,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体;根据识别出的中医理论典籍中的实体,利用结合注意力机制的双向门控循环单元神经网络进行关系抽取,获取中医理论典籍中实体之间的关系,形成实体关系表;以实体关系表中的实体为节点集,实体关系表中的关系为边集,构建中医理论典籍的知识图谱。本发明涉及知识工程领域。
-
公开(公告)号:CN109215798B
公开(公告)日:2023-04-07
申请号:CN201811174093.4
申请日:2018-10-09
Applicant: 北京科技大学
IPC: G16H50/70
Abstract: 本发明提供一种面向中医古文的知识库构建方法,能够快速构建面向中医古文的知识库,省时省力。所述方法包括:对中医古文语料进行关键词提取获取词频大于预设的词频阈值的实体,形成种子实体词表;根据种子实体词表,筛选出中医古文语料中具有两个及两个以上实体的句子,利用依存句法分析得到实体之间的动词关系,形成种子动词词表;根据种子动词词表,扩充种子实体词表;迭代执行形成种子动词词表和扩充种子实体词表的步骤,直到不能获取到新的实体和动词,形成实体关系三元组;根据得到的种子实体词表进行层次聚类,得到分类后的实体词表,并结合得到的实体关系三元组,构建面向中医古文知识库。本发明涉及知识工程领域。
-
-
-
-
-
-
-
-
-