一种用于层次化聚类的方法和系统

    公开(公告)号:CN110825823B

    公开(公告)日:2023-04-07

    申请号:CN201910978112.7

    申请日:2019-10-15

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于层次化聚类的方法、系统和计算机存储介质。该方法包括:获取多个同质数据源,所述多个同质数据源包括同一性质的数据源;获取知识库中所述多个同质数据源对应的层次化结构,所述层次化结构是多个节点组成的有向无环图,每个节点表示一个类别;利用所述多个同质数据源以及所述同质数据源对应的层次化结构获取约束树,其中所述约束树利用了所述多个同质数据源的至少一部分,并可用于对所述多个同质数据源进行层次化聚类。

    对小样本学习任务生成集成分类器的可视分析系统和方法

    公开(公告)号:CN113344038A

    公开(公告)日:2021-09-03

    申请号:CN202110542475.3

    申请日:2021-05-18

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于对小样本学习任务生成集成分类器的可视分析系统和方法,其中,系统包括:接收模块用于接收多个基学习器和多个样本;基学习器选择模块用于根据多个基学习器和多个样本,选择适合小样本学习任务的基学习器;样本选择模块用于根据选择的基学习器和多个样本,选择适合小样本学习任务的有标注样本;集成分类器生成模块用于根据选择的基学习器和选择的有标注样本,生成集成分类器;可视化模块用于显示集成分类器对多个样本的分类结果。

    一种用于获取数据分布的概念漂移量的方法和系统

    公开(公告)号:CN111626351A

    公开(公告)日:2020-09-04

    申请号:CN202010452947.1

    申请日:2020-05-26

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于获取数据分布的概念漂移量的方法和系统。其中,该方法包括:获取包括训练数据和测试数据的全部数据;使用高斯混合模型对全部数据进行聚类,获取全部数据的多个聚类簇;分别获取多个聚类簇的每个聚类簇中包含的所有数据的数据分布的概念漂移量;利用多个聚类簇的每个聚类簇中包含的所有数据的数据分布的概念漂移量,获取全部数据的数据分布的概念漂移量。由此,能够准确地获取到数据分布的概念漂移量,以准确地判断出数据分布的变化情况,大大提高了系统的可靠性。

Patent Agency Ranking