-
公开(公告)号:CN111191466A
公开(公告)日:2020-05-22
申请号:CN201911352416.9
申请日:2019-12-25
Applicant: 中国科学院计算机网络信息中心
IPC: G06F40/35 , G06F40/279 , G06F16/35
Abstract: 本发明公开了一种基于网络表征和语义表征的同名作者消歧方法。本方法为:1)提取目标论文库中各论文的语义特征和离散特征;2)基于离散特征计算各论文间的相似度,得到论文的关系相似性矩阵;如果一论文与其他论文没有共同作者或机构,则将其加入一离群论文集中;3)基于各论文的所述语义特征计算论文的语义相似度矩阵;将目标论文库中不包含语义特征的论文加入离群论文集中;4)将关系相似性矩阵和语义相似度矩阵加权求和,获得论文相似度矩阵并对其进行聚类;将不属于任何簇的论文加入离群论文集中;5)利用基于相似度阈值匹配的方法将离群论文集中的论文分配到对应的簇中。本发明实现高准确率的论文同名作者的消歧。
-
公开(公告)号:CN111191466B
公开(公告)日:2022-04-01
申请号:CN201911352416.9
申请日:2019-12-25
Applicant: 中国科学院计算机网络信息中心
IPC: G06F40/35 , G06F40/279 , G06F16/35
Abstract: 本发明公开了一种基于网络表征和语义表征的同名作者消歧方法。本方法为:1)提取目标论文库中各论文的语义特征和离散特征;2)基于离散特征计算各论文间的相似度,得到论文的关系相似性矩阵;如果一论文与其他论文没有共同作者或机构,则将其加入一离群论文集中;3)基于各论文的所述语义特征计算论文的语义相似度矩阵;将目标论文库中不包含语义特征的论文加入离群论文集中;4)将关系相似性矩阵和语义相似度矩阵加权求和,获得论文相似度矩阵并对其进行聚类;将不属于任何簇的论文加入离群论文集中;5)利用基于相似度阈值匹配的方法将离群论文集中的论文分配到对应的簇中。本发明实现高准确率的论文同名作者的消歧。
-