一种用于对样本进行加权的可视分析系统和方法

    公开(公告)号:CN116701879A

    公开(公告)日:2023-09-05

    申请号:CN202310840644.0

    申请日:2023-07-10

    Abstract: 本发明提出一种用于对样本进行加权的可视分析系统和方法,其中,方法包括:接收多个验证样本和多个训练样本,其中多个训练样本中的第一部分样本已知其类别标注正确,第二部分样本已知其类别标注错误,并且剩余的第三部分样本未知其类别标注是否正确;根据多个验证样本和多个训练样本,生成每个验证样本对每个训练样本的加权关系;根据第一部分样本和第二部分样本,以及每个验证样本对每个训练样本的加权关系,通过迭代更新每个验证样本的权重并计算对应的多个验证样本的正确性和平衡性,生成每个验证样本的最终权重;以及显示多个验证样本、多个训练样本、每个验证样本对每个训练样本的加权关系、以及每个验证样本的最终权重。

    用于对样本进行可视化的方法、系统和可读存储介质

    公开(公告)号:CN116578374A

    公开(公告)日:2023-08-11

    申请号:CN202310633032.4

    申请日:2023-05-31

    Abstract: 本发明公开了用于对样本进行可视化的方法、系统和可读存储介质。其中,系统包括:接收模块用于接收多个样本,其中每个样本的信息包括该样本对应的特征向量、该样本的聚类类别与标注类别;投影模块用于根据多个样本中的每个样本的特征,获得多个样本在二维平面上的投影点的位置;网格生成模块用于根据多个样本中的每个样本将其投影点的位置,获得多个样本在二维平面上对应的网格;网格调整模块用于迭代调整样本对应的网格的位置,从而获取多个样本对应的网格更新后的位置;可视化模块被配置为根据多个样本中的每个样本对应的网格与网格更新后的位置,在二维平面上对多个样本进行可视化展示。

    一种用于层次化聚类的方法和系统

    公开(公告)号:CN110825823A

    公开(公告)日:2020-02-21

    申请号:CN201910978112.7

    申请日:2019-10-15

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于层次化聚类的方法、系统和计算机存储介质。该方法包括:获取多个同质数据源,所述多个同质数据源包括同一性质的数据源;获取知识库中所述多个同质数据源对应的层次化结构,所述层次化结构是多个节点组成的有向无环图,每个节点表示一个类别;利用所述多个同质数据源以及所述同质数据源对应的层次化结构获取约束树,其中所述约束树利用了所述多个同质数据源的至少一部分,并可用于对所述多个同质数据源进行层次化聚类。

    用于决策树集成模型的可视化分析方法、系统和程序产品

    公开(公告)号:CN118861151A

    公开(公告)日:2024-10-29

    申请号:CN202410896296.3

    申请日:2024-07-05

    Abstract: 本申请公开了一种用于决策树集成模型的可视化分析系统、方法和计算机程序产品,方法包括:接收决策树集成模型,其中,所述决策树集成模型包含多个决策规则,所述多个决策规则的每个决策规则包含至少一个决策条件和决策结果,所述决策树集成模型用于根据所述多个决策规则实现对任务样本的决策;基于所述多个决策规则中的每个决策规则的至少一个决策条件和决策结果,判别所述每个决策规则是否合理;以及在可视分析页面显示所述多个决策规则中的至少一个决策规则,包括显示所述至少一个决策规则的至少一个决策条件和决策结果。采用上述技术方案可以实现对决策树集成模型的可视化分析以及可视化展示,从而改善用户体验。

    用于对样本的层次化分类数据渲染的可视化系统及方法

    公开(公告)号:CN118839045A

    公开(公告)日:2024-10-25

    申请号:CN202410856490.9

    申请日:2024-06-28

    Applicant: 清华大学

    Abstract: 本公开提出了一种用于对样本的层次化分类数据渲染的可视化系统、方法和计算机程序产品,该方法包括:接收对样本的层次化分类数据中特定层的多个样本的层次化分类数据渲染的请求;确定多个样本在所述可视空间的位置信息;将多个样本投影到可视空间;确定每个类别的样本的颜色范围;确定特定层中每个类别样本的颜色,使确定的特定层中每个类别样本的颜色与特定层中其他类别样本的颜色满足和谐性、可区分性并且适应数据的空间分布;以及在可视空间渲染特定层的多个样本的层次化分类数据。利用该可视化系统及方法,用户能够更容易地进行层次化分类数据的探索和分析,并保持探索过程中思维的连贯性。

    一种用于获取数据分布的概念漂移量的方法和系统

    公开(公告)号:CN111626351B

    公开(公告)日:2024-03-22

    申请号:CN202010452947.1

    申请日:2020-05-26

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于获取数据分布的概念漂移量的方法和系统。其中,该方法包括:获取包括训练数据和测试数据的全部数据;使用高斯混合模型对全部数据进行聚类,获取全部数据的多个聚类簇;分别获取多个聚类簇的每个聚类簇中包含的所有数据的数据分布的概念漂移量;利用多个聚类簇的每个聚类簇中包含的所有数据的数据分布的概念漂移量,获取全部数据的数据分布的概念漂移量。由此,能够准确地获取到数据分布的概念漂移量,以准确地判断出数据分布的变化情况,大大提高了系统的可靠性。

    大规模数据集进行网格布局的可视化的系统、方法和计算机程序产品

    公开(公告)号:CN118839044A

    公开(公告)日:2024-10-25

    申请号:CN202410855806.2

    申请日:2024-06-28

    Abstract: 本发明公开了大规模数据集进行网格布局的可视化的计算机系统、方法和程序产品,方法包括:获取带有类别层次结构的大规模数据集以及在显示页面上显示的样本个数K,大规模数据集包含N个样本、类别层次结构以及样本对类别的隶属度;从N个样本中随机抽取第一组K个样本;计算第一组K个样本中每个样本对于第一类别中每个类别的隶属度;计算第一组K个样本中每个样本在显示页面上的布局位置;为第一类别中的每个类别分配一种颜色;在显示页面上显示第一组K个样本。该系统、方法和程序产品能够在对带有类别层次结构的大规模数据集进行探索的过程中保持视觉的稳定性,及将混淆样本放置在混淆聚类类别的边界处,使用户容易追踪与分析数据。

    对小样本学习任务生成集成分类器的可视分析系统和方法

    公开(公告)号:CN113344038B

    公开(公告)日:2024-10-15

    申请号:CN202110542475.3

    申请日:2021-05-18

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于对小样本学习任务生成集成分类器的可视分析系统和方法,其中,系统包括:接收模块用于接收多个基学习器和多个样本;基学习器选择模块用于根据多个基学习器和多个样本,选择适合小样本学习任务的基学习器;样本选择模块用于根据选择的基学习器和多个样本,选择适合小样本学习任务的有标注样本;集成分类器生成模块用于根据选择的基学习器和选择的有标注样本,生成集成分类器;可视化模块用于显示集成分类器对多个样本的分类结果。

    对关系数据进行关系分析的可视化系统和方法

    公开(公告)号:CN118656428A

    公开(公告)日:2024-09-17

    申请号:CN202410762533.7

    申请日:2024-06-13

    Applicant: 清华大学

    Abstract: 本公开提出了一种对关系数据进行关系分析的可视化系统,该系统包括:接收模块,被配置为接收维度为M×M的关系数据矩阵;处理模块,被配置为对所述关系数据矩阵应用训练的重排序模型进行重新排序,以获得重排序矩阵,使得所述重排序矩阵中突出该关系数据中的以下结构的至少之一:聚类、二分图、中心节点以及路径结构,其中所述训练的重排序模型是使用具有不同关系的多个维度为N×N的关系数据矩阵实例及其对应的最佳重排序矩阵作为训练样本进行训练的,并且其中N大于等于M;以及显示模块,被配置为在显示平面上显示所述关系数据矩阵以及所述重排序矩阵。该可视化系统能够有效地突出关系数据中存在的不同结构。

Patent Agency Ranking