-
公开(公告)号:CN117370383A
公开(公告)日:2024-01-09
申请号:CN202311530204.1
申请日:2023-11-16
Applicant: 中南大学
IPC: G06F16/2453 , G06F18/23213
Abstract: 本发明公开了一种基于数据转换和分区模型的并发学习索引方法,包括获取历史查询数据键,判断数据键类型,划分为数值型键数据和字符串型键数据;针对确定的数值型键数据进行数值型键数据处理;针对确定的字符串型键数据进行字符串型键数据处理;采用处理后得到的数值型键数据,训练数值型键学习索引模型;采用处理后得到的若干个字符串型键分区,训练字符串型键学习索引模型;针对待查询数据进行数据键类型判断处理,根据判断后的类型,选择对应的数据处理方式进行数据处理;选择对应的学习索引模型确定分组,并根据分组结果,在对应的分组中查询数据,完成索引处理;本发明方法的性能提升、精度提高、效果显著。
-
公开(公告)号:CN114722013B
公开(公告)日:2025-01-03
申请号:CN202210202531.3
申请日:2022-03-03
Applicant: 中南大学
IPC: G06F16/174 , G06F21/62 , G06F21/64 , G06F18/22
Abstract: 本发明公开了一种用于医疗大数据的重复数据删除方法,包括获取待处理的医疗数据;对医疗数据进行相似度计算得到按照最大相似度排序的数据文件;根据数据文件进行重复数据删除操作,再进行基于最大相似度的重写实现医疗重复数据的删除。本发明提供的这种用于医疗大数据的重复数据删除方法,基于相似度计算确定医疗数据是否冗余并且同时去除噪点数据,基于最大相似度重写数据块提升了恢复性能和删除性能,通过设计区块链策略及重复数据删除的恢复算法高效保证了医疗数据的安全性和完整性;因此本发明方法适用于医疗行业,而且效率高,安全性好。
-
公开(公告)号:CN114722013A
公开(公告)日:2022-07-08
申请号:CN202210202531.3
申请日:2022-03-03
Applicant: 中南大学
IPC: G06F16/174 , G06F21/62 , G06F21/64 , G06K9/62
Abstract: 本发明公开了一种用于医疗大数据的重复数据删除方法,包括获取待处理的医疗数据;对医疗数据进行相似度计算得到按照最大相似度排序的数据文件;根据数据文件进行重复数据删除操作,再进行基于最大相似度的重写实现医疗重复数据的删除。本发明提供的这种用于医疗大数据的重复数据删除方法,基于相似度计算确定医疗数据是否冗余并且同时去除噪点数据,基于最大相似度重写数据块提升了恢复性能和删除性能,通过设计区块链策略及重复数据删除的恢复算法高效保证了医疗数据的安全性和完整性;因此本发明方法适用于医疗行业,而且效率高,安全性好。
-
-