一种数据脱敏处理方法及装置
    1.
    发明公开

    公开(公告)号:CN119128961A

    公开(公告)日:2024-12-13

    申请号:CN202411078320.9

    申请日:2024-08-06

    Abstract: 本申请公开了一种数据脱敏处理方法及装置,获取待脱敏数据,通过预先构建的逻辑连贯性脱敏模型,对待脱敏数据进行逻辑连贯性脱敏,得到脱敏语料,其中,逻辑连贯性脱敏为保留各个数据项之间逻辑关系的脱敏,逻辑关系至少包括计算关系、地域关系、时间关系和对比关系。通过上述方案,由于多个数据项之间存在上下文逻辑关系,为了在脱敏的时候保持脱敏的逻辑关系,通过预先构建的逻辑连贯性脱敏模型,对待脱敏数据进行逻辑连贯性脱敏,逻辑连贯性脱敏为保留各个数据项之间计算关系、地域关系、时间关系、对比关系等逻辑关系的脱敏,实现在对数据进行脱敏的过程中得到保留逻辑关系的脱敏语料的目的。

    一种短文本匹配方法、装置、设备及存储介质

    公开(公告)号:CN117349487A

    公开(公告)日:2024-01-05

    申请号:CN202311528792.5

    申请日:2023-11-16

    Inventor: 卢红波 秦坤 肖威

    Abstract: 本申请公开了一种短文本匹配方法、装置、设备及存储介质,涉及文本分类技术领域,包括:对为目标业务数据编写的各正则表达式进行预处理,并对预处理后表达式进行分类得到多个分类后表达式组,并对各分类后表达式组中的正则表达式进行相似度计算得到第一相似度值;判断第一相似度值是否超过第一阈值,若是则从超过第一阈值的第一相似度值对应的分类后表达式组中确定出任意一个正则表达式得到目标表达式,并删除各分类后表达式组中除目标表达式外的所有表达式得到第一删除后表达式组;利用优化后的DBSCAN算法对所有第一删除后表达式组中的表达式进行聚类得到聚类后表达式簇以对短文本进行匹配。本申请能够提高短文本匹配的准确率和效率,降低误报率。

    一种文本数据的分类方法及装置
    3.
    发明公开

    公开(公告)号:CN119046738A

    公开(公告)日:2024-11-29

    申请号:CN202411237491.1

    申请日:2024-09-04

    Inventor: 卢红波 秦坤 肖威

    Abstract: 本发明公开了一种文本数据的分类方法及装置,涉及文字处理领域,包括获取当前文本数据,当前文本数据包括多个词语;对当前文本数据中的多个词语分别进行分词提取;将提取后的当前文本数据输入至分类模型中,得到分类模型基于当前文本数据中的词语及预先确定的正则表达式输出的当前文本数据对应的类别。无需人工对文本数据进行手动划分,而是采用分类模型进行划分,分类模型是基于正则表达式对当前文本数据进行分类,正则表达式包括类别对应的词语的组合,采用正则表达式判断更加准确。

Patent Agency Ranking