面向连续学习场景的样本分类方法与装置

    公开(公告)号:CN115526250A

    公开(公告)日:2022-12-27

    申请号:CN202211168182.4

    申请日:2022-09-23

    Applicant: 清华大学

    Inventor: 高跃 张欣炜 万海

    Abstract: 本申请涉及一种面向连续学习场景的样本分类方法与装置,方法包括:基于预设的初始知识库,在识别连续学习场景中的无标签数据为未知类样本时,分裂预设的初始分类模型得到动态分支,并对其应用预设的无监督学习算法学习未知类样本上的聚类,得到动态分支的聚类能力,并基于动态分支的聚类能力,为未知类样本标记伪标签,进而更新初始知识库,计算未知类样本与更新后的初始知识库中样本的第一距离,从而预测未知类样本的类别。由此,解决了相关技术中的算法易忽视已知类别的分类功能,无法从无标签数据流中学习,限制了分类能力的应用等问题,通过融合连续学习与新类挖掘,实现了对未知类别的挖掘和对已知类别的分类能力的保持。

    基于超图结构优化的大数据分类方法及装置

    公开(公告)号:CN117421438A

    公开(公告)日:2024-01-19

    申请号:CN202311315121.0

    申请日:2023-10-11

    Applicant: 清华大学

    Inventor: 高跃 张欣炜

    Abstract: 本申请涉及一种基于超图结构优化的大数据分类方法及装置,其中,方法包括:根据输入数据的特征计算数据之间的相似性,并利用超图模型建立输入数据的表示;基于超图神经网络,对输入数据进行分类,并根据分类结果衡量超图结构与输入数据之间的匹配程度,得到匹配程度的评价结果;基于评价结果,对超图结构进行优化演化,获得在当前输入数据下更优的超图结构,迭代优化,直到达到预设超图结构收敛条件,得到用于大数据分类的最优超图结构,以得到任一大数据的分类结果。由此,解决了相关技术中,通常仅考虑超图结构本身,忽略了超图结构与输入数据之间的匹配程度,无法很好地处理特征不确定性和复杂关系等问题。

    基于图结构演化的分类方法及装置

    公开(公告)号:CN114021619A

    公开(公告)日:2022-02-08

    申请号:CN202111179597.7

    申请日:2021-10-09

    Applicant: 清华大学

    Inventor: 高跃 张欣炜

    Abstract: 本申请涉及分类任务技术领域,特别涉及一种基于图结构演化的分类方法及装置,其中,方法包括:计算输入样本特征之间的相似性,并利用数据之间的相似性构建作为初始图结构的图模型;通过图神经网络获得模型初步的预测结果,并对图结构与输入数据之间的匹配程度进行衡量与评价,得到评价结果;基于评价结果,使用基于梯度下降的方式对图结构进行演化更新,获得在当前输入数据下更优的图结构,并在图结构收敛后,停止迭代演化更新,得到最优图结构;使用最优图结构重新通过图神经网络进行推理,得到最终的模型预测结果。本申请实施例在传统的图神经网络中融入图结构质量评价与优化过程,从而提高模型对复杂关联的建模能力,进而提升模型面对分类任务时的性能。

    超图连续学习方法、装置、电子设备及存储介质

    公开(公告)号:CN116310451A

    公开(公告)日:2023-06-23

    申请号:CN202310108429.1

    申请日:2023-02-03

    Abstract: 本申请涉及一种超图连续学习方法、装置、电子设备及存储介质,其中,方法包括:提取样本特征,并基于预设度量方式利用样本特征建立超图;面向连续学习过程中结点与超边不断增加的超图,使用基于预设采样策略或基于预设聚类策略获得表达原始超图结构的第一子超图;合并第一子超图与新增的超边、结点所构成的超图,获得表达增长后的超图结构的第二子超图;基于第二子超图,利用基于预设超图神经网络的学习方法获得对无标签结点的预测结果。由此,解决了相关技术中,在进行超图学习时,忽略超图对复杂高阶关联的刻画能力,使得连续学习过程中分类任务的准确率降低,难以提升模型的运算效率,提高了模型对内存的需求等问题。

    时序超图序列预测方法及装置
    5.
    发明公开

    公开(公告)号:CN116186114A

    公开(公告)日:2023-05-30

    申请号:CN202310088801.7

    申请日:2023-01-17

    Applicant: 清华大学

    Inventor: 高跃 张欣炜

    Abstract: 本申请涉及超图学习技术领域,特别涉及一种时序超图序列预测方法及装置,其中,方法包括:对时序序列中的每一个超图,使用预设超图神经网络提取每个结点的空间特征,生成空间特征序列;针对空间特征序列,使用预设循环神经网络提取每个结点的时间特征;使用交叉熵函数与参数正则项作为模型的损失函数,对模型进行训练,得到用于时序超图序列预测的最终模型。由此,解决了相关技术中通过超图学习刻画样本之间的复杂关联,无法高效的挖掘数据背后的复杂关联,降低了处理时序序列的效率,并且降低特征表示的准确性和鲁棒性等问题。

Patent Agency Ranking