一种基于多粒度与对比学习的异构表格数据分类方法

    公开(公告)号:CN119004209A

    公开(公告)日:2024-11-22

    申请号:CN202411099686.4

    申请日:2024-08-12

    Abstract: 本发明涉及一种基于多粒度与对比学习的异构表格数据分类方法,包括:获取待检测的异构表格数据,将其依次输入训练后的编码器网络和分类器网络,输出特定标签的分类结果;其网络训练过程包括:获取第一训练样本集,对提取样本中各列数据的特征,经过特征分解与合并得到全局特征集;将全局特征集随机划分特征子集,在特征子集下对样本进行聚类,根据聚类结果构建正负样本对;利用该正负样本对迭代优化编码器网络;获取与待检测的异构表格数据相关的且带有特定标签的第二训练样本,对其编码后输入分类器网络,迭代优化分类器网络。本发明可以提高异构表格数据的分类预测准确性,本发明中的编码器网络和分类器网络具有更优的鲁棒性和泛化能力。

    一种基于对比学习的ICU患者死亡风险预测方法

    公开(公告)号:CN115148359A

    公开(公告)日:2022-10-04

    申请号:CN202210783403.2

    申请日:2022-07-05

    Abstract: 本发明属于风险预测技术领域,具体涉及一种基于对比学习的ICU患者死亡风险预测方法;该方法包括:获取ICU患者的电子病历数据集并对其进行处理,得到多个批次数据样本;将批次内数据样本输入到构建好的基于transformer‑gru‑cnn的分类器中,得到分类损失函数;构建辅助对比学习损失函数;根据分类损失函数和辅助对比学习损失函数构建优化损失函数;根据优化损失函数对分类器的参数进行更新,得到构建好的基于对比学习的ICU患者死亡风险预测模型;将电子病历数据输入到构建好的基于对比学习的ICU患者死亡风险预测模型,得到待预测患者的死亡风险预测结果;本发明的预测精度高,实用性高,具有良好的应用前景。

    基于用户行为检测的新闻推荐方法、系统及计算机设备

    公开(公告)号:CN110489652B

    公开(公告)日:2022-06-03

    申请号:CN201910784984.X

    申请日:2019-08-23

    Abstract: 本发明涉及一种基于用户行为数据检测的新闻推荐方法、系统及计算机设备,所述方法包括:对用户新闻点击行为数据进行转换,生成可处理的用户行为数据集,过滤掉用户行为数据集中的非频繁行为,使用频繁项集串行挖掘算法获取相对频繁项集,构建由用户行为中的相对频繁项集形成的相对频繁项集树,找出最优频繁项集,计算用户行为中最优频繁项集的完整支持度,根据完整支持度,生成用户行为频繁项集相关的关联规则,根据关联规则向用户推荐新闻,本发明能够充分考虑真实生产环境,高效地处理海量用户行为数据集,属于数据分析技术领域。

    一种基于聚类和关联规则的线上用户群体分类方法及装置

    公开(公告)号:CN110532429A

    公开(公告)日:2019-12-03

    申请号:CN201910832959.4

    申请日:2019-09-04

    Abstract: 本发明涉及计算机技术领域,特别涉及一种基于聚类和关联规则的线上用户群体分类方法及装置,所述方法包括确定作为聚类中心的用户,利用简单匹配的方法对用户信息数据集中单值离散特征进行相似度计算;将关联规则引入到杰卡德距离的计算过程中,并以此分别计算每个用户与聚类中心的用户之间兴趣特征的相似度;将单值离散特征与兴趣特征计算出的相似度进行加权相加,获得综合用户相似度;根据综合用户相似度对所有用户更新分簇,确定每个簇的中心,当前中心用户的各特征值与上一次更新的中心用户的特征相同,则输出分簇的用户群体,完成分类;本发明解决了簇中心的更新过程中无法对多值离散特征进行合理更新的问题,并提高了用户行为聚类的质量。

    基于LDTW距离的灰关联聚类方法

    公开(公告)号:CN108154189A

    公开(公告)日:2018-06-12

    申请号:CN201810022935.8

    申请日:2018-01-10

    CPC classification number: G06K9/6215 G06K9/6226

    Abstract: 本发明涉及挖掘领域,具体为基于LDTW距离的灰关联聚类方法,包括:将原始数据集进行处理,得到预处理后的序列;将预处理后的序列中每个维度的最大值构成参考序列;计算预处理后的序列与参考序列的LDTW距离及其弯曲路径长度;计算基于LDTW距离的预处理后的序列与参考序列间的灰关联度;根据灰关联度的结果取定临界值区间,将临界值区间划分为多个临界区间,若两个序列的灰关联度落在同一临界区间,则将所述两个序列聚为一类,本发明降低了两个序列之间的相似度量的误差,可以为生物学家研究蛋白质的功能提供帮助。

    一种基于注意力的深度学习方法预测AD转换概率的方法

    公开(公告)号:CN119993535A

    公开(公告)日:2025-05-13

    申请号:CN202510086087.7

    申请日:2025-01-20

    Abstract: 本发明属于数据挖掘技术领域,具体涉及一种基于注意力的深度学习方法预测AD转换概率的方法,包括:获取待预测患者的各项检查数据,将数据按照随访特征和基线特征划分为随访数据和基线数据;对随访数据进行预处理后,输入到构建好的基模型,得到随访数据表示;将随访数据表示结合基线数据输入最终决策器,得到待预测患者下一次访问由MCI转换为AD的概率。本发明基于注意力机制的原理,针对现在的时间序列数据的预测场景,我们设计了一种注意力的变体形式,为不同的特征和时间点赋予权重,借此来捕获特征间以及时间点的关系,确定不同特征和时间点的重要性。

    一种基于时空演化的社交好友推荐方法

    公开(公告)号:CN119149987A

    公开(公告)日:2024-12-17

    申请号:CN202411152668.8

    申请日:2024-08-21

    Inventor: 代劲 彭艳辉 程倩

    Abstract: 本发明属于数据挖掘领域,具体涉及一种基于时空演化的社交好友推荐方法;包括:获取历史多个时刻的社交网络图并提取邻接矩阵和用户特征矩阵;将邻接矩阵和用户特征矩阵输入到图卷积神经网络中进行处理,得到多个快照的社交空间特征;采用多维云模型对多个快照的社交空间特征进行处理,得到三个数字特征序列;其中,三个数字特征序列分别表示为Ex、En和He。采用灰色预测模型对三个数字特征序列进行处理,得到第一发展矩阵和第二发展矩阵;根据第一发展矩阵和第二发展矩阵对三个数字特征序列进行预测,得到三个预测数字特征;将三个预测数字特征输入到解码器,得到预测邻接矩阵即好友推荐结果;本发明可以预测用户关系的发展趋势。

    一种基于增量式极限学习机的煤矿安全风险预警方法

    公开(公告)号:CN114648217B

    公开(公告)日:2024-12-17

    申请号:CN202210263310.7

    申请日:2022-03-17

    Inventor: 代劲 桑勤鸣

    Abstract: 本发明属于计算机/煤矿安全领域,具体涉及一种基于增量式极限学习机的煤矿安全风险预警方法,该方法包括:构建基于增量式极限学习机的煤矿安全风险预测模型;实时获取煤矿数据,对该数据进行预处理,将预处理后的数据输入到训练好的基于增量式极限学习机的煤矿安全风险预测模型中,得到该煤矿安全风险预测结果;根据煤矿安全风险预测结果对该煤矿进行预警;本发明的模型预测输出和实际事故发生状况拟合度更好,且预测输出稳定性较好,没有出现大幅度的波动,即本发明对煤矿风险预测结果更可靠,更有优势。

    一种基于多粒度瓦斯数据的煤矿瓦斯浓度预测方法及装置

    公开(公告)号:CN116341709B

    公开(公告)日:2024-11-15

    申请号:CN202310095933.2

    申请日:2023-02-10

    Inventor: 代劲 庄世鹏

    Abstract: 本发明属于计算机/煤矿安全领域,具体涉及一种基于多粒度瓦斯数据的煤矿瓦斯浓度预测方法及装置,方法包括:根据传感器的位置构有向稀疏邻接矩阵,通过神经网络学习更新矩阵中的权值,使得融合相关多个传感器的数据特征,得到当前传感器的空间位置特征;获取当前传感器的空间位置特征在各个时间粒度下的数据,通过多头注意力机制获取各个时间粒度下输入数据的特征对应的时空信息,并删除该时空信息中重复的信息;将获取的时空信息输入预测模块,得到各个时间粒度下的当前传感器的浓度预测值,将各个时间粒度下的预测值融合作为当前传感器的最终预测值;本发明提高对煤矿瓦斯浓度预测结果准确性。

Patent Agency Ranking