-
公开(公告)号:CN114168824A
公开(公告)日:2022-03-11
申请号:CN202111510280.7
申请日:2021-12-10
Applicant: 中南大学
IPC: G06F16/906 , G06K9/62 , G06N20/00
Abstract: 本公开实施例中提供了一种基于机器学习的冷热数据分离方法、系统、设备及介质,属于数据识别技术领域,具体包括:获取训练集;对训练集进行预处理操作;利用高斯混合模型的最大期望混合聚类方法进行聚类,得到第一分类结果;利用K近邻分类算法进行分类,得到第二分类结果;判断第一分类结果与第二分类结果是否相同;若是,则判定待分类请求的类型与第一分类结果相同;若否,则采用最近邻原则对第一分类结果和第二分类结果进行修正,以及更新热数据集。通过本公开的方案,以已知标签的请求作为参考,利用多种机器算法从多个维度对待分类请求进行分类识别,然后根据识别结果进行进一步分析,确定待分类请求的数据类型。
-
公开(公告)号:CN115827860A
公开(公告)日:2023-03-21
申请号:CN202211466504.3
申请日:2022-11-22
Applicant: 中南大学
IPC: G06F16/35 , G06F40/30 , G06F18/22 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本公开实施例中提供了一种基于联合注意力网络的国际疾病自动分类方法,属于数据处理技术领域,具体包括:得到文档表示;将文档表示输入卷积神经网络进行编码;生成文档到标签的基于文档的注意力表示;得到标签表示;根据文档表示和标签表示计算医学文档和每个标签的相似度;将相似度矩阵通过卷积神经网络和注意力机制得到基于标签注意力的文档表示;将基于文档的注意力表示和基于标签的注意力表示输入自适应融合层,得到多标签分类输出结果;将多标签分类输出结果输入Cornet块,挖掘多标签之间的相关度,进一步优化分类结果和加速模型收敛。通过本公开的方案,解决了长尾标签分布中密集和稀疏数据的分类和挖掘标签相关性问题。
-