-
公开(公告)号:CN110825823B
公开(公告)日:2023-04-07
申请号:CN201910978112.7
申请日:2019-10-15
Applicant: 清华大学
Abstract: 本发明提出了一种用于层次化聚类的方法、系统和计算机存储介质。该方法包括:获取多个同质数据源,所述多个同质数据源包括同一性质的数据源;获取知识库中所述多个同质数据源对应的层次化结构,所述层次化结构是多个节点组成的有向无环图,每个节点表示一个类别;利用所述多个同质数据源以及所述同质数据源对应的层次化结构获取约束树,其中所述约束树利用了所述多个同质数据源的至少一部分,并可用于对所述多个同质数据源进行层次化聚类。
-
公开(公告)号:CN110825823A
公开(公告)日:2020-02-21
申请号:CN201910978112.7
申请日:2019-10-15
Applicant: 清华大学
Abstract: 本发明提出了一种用于层次化聚类的方法、系统和计算机存储介质。该方法包括:获取多个同质数据源,所述多个同质数据源包括同一性质的数据源;获取知识库中所述多个同质数据源对应的层次化结构,所述层次化结构是多个节点组成的有向无环图,每个节点表示一个类别;利用所述多个同质数据源以及所述同质数据源对应的层次化结构获取约束树,其中所述约束树利用了所述多个同质数据源的至少一部分,并可用于对所述多个同质数据源进行层次化聚类。
-