一种用于医疗大数据的重复数据删除方法

    公开(公告)号:CN114722013B

    公开(公告)日:2025-01-03

    申请号:CN202210202531.3

    申请日:2022-03-03

    Applicant: 中南大学

    Abstract: 本发明公开了一种用于医疗大数据的重复数据删除方法,包括获取待处理的医疗数据;对医疗数据进行相似度计算得到按照最大相似度排序的数据文件;根据数据文件进行重复数据删除操作,再进行基于最大相似度的重写实现医疗重复数据的删除。本发明提供的这种用于医疗大数据的重复数据删除方法,基于相似度计算确定医疗数据是否冗余并且同时去除噪点数据,基于最大相似度重写数据块提升了恢复性能和删除性能,通过设计区块链策略及重复数据删除的恢复算法高效保证了医疗数据的安全性和完整性;因此本发明方法适用于医疗行业,而且效率高,安全性好。

    一种用于医疗大数据的重复数据删除方法

    公开(公告)号:CN114722013A

    公开(公告)日:2022-07-08

    申请号:CN202210202531.3

    申请日:2022-03-03

    Applicant: 中南大学

    Abstract: 本发明公开了一种用于医疗大数据的重复数据删除方法,包括获取待处理的医疗数据;对医疗数据进行相似度计算得到按照最大相似度排序的数据文件;根据数据文件进行重复数据删除操作,再进行基于最大相似度的重写实现医疗重复数据的删除。本发明提供的这种用于医疗大数据的重复数据删除方法,基于相似度计算确定医疗数据是否冗余并且同时去除噪点数据,基于最大相似度重写数据块提升了恢复性能和删除性能,通过设计区块链策略及重复数据删除的恢复算法高效保证了医疗数据的安全性和完整性;因此本发明方法适用于医疗行业,而且效率高,安全性好。

Patent Agency Ranking