一种半结构化数据中个人标识信息识别方法与系统

    公开(公告)号:CN117827991A

    公开(公告)日:2024-04-05

    申请号:CN202410253586.6

    申请日:2024-03-06

    Abstract: 本发明涉及信息安全技术领域,尤其涉及一种半结构化数据中个人标识信息识别方法与系统。该方法包括数据表读取和识别结果汇总保存,还包括数据预处理和靶向识别,所述数据预处理即将待识别的数据表按字段拆分为包含字段名、字段数据类型的字段描述信息和字段实际记录信息的单个字段,所述靶向识别包括预设模板识别和最小覆盖识别。本发明能够高效的对其中包含的个人标记信息进行识别,帮助相关从业人员了解数据表中的个人信息情况。

    面向数据开放的高性能个人信息脱敏方法与系统

    公开(公告)号:CN117708883B

    公开(公告)日:2024-10-29

    申请号:CN202410153939.5

    申请日:2024-02-04

    Abstract: 本发明涉及信息安全技术领域,尤其涉及一种面向数据开放的高性能个人信息脱敏方法与系统。该方法包括通过待脱敏数据获取,确认需要识别的个人信息类型及其识别规则,并确认对应的个人信息类型在进行脱敏处理时的脱敏策略,个人信息识别与定位和对识别到的承载个人信息的字符进行自适应脱敏处理,并根据字符定位在副本数据表中完成替换。通过本发明的脱敏方法和系统实现的面向数据开放的个人信息脱敏处理,可兼顾个人信息保护和数据开放场景下数据的真实性和可用性。

    一种用于数据表的个人信息披露情况统计分析方法及系统

    公开(公告)号:CN116340387A

    公开(公告)日:2023-06-27

    申请号:CN202310257243.2

    申请日:2023-03-17

    Abstract: 本方案公开了一种用于数据表的个人信息披露情况统计分析方法及系统,提出了一种新的数据处理方法,对数据表制作数据目录,并基于数据目录对个人信息相关数据表进行初步标注和分类,然后再对筛选出来的个人信息相关数据表进行字段内容的全面识别,准确且高效地完成字段标识符的标注;在前述处理基础上,依据是否存在直接标识符信息记录行将数据表进行划分,依据是否含有直接标识符信息记录行对数据表进行拆分重组,能够有效提高后续处理分析和统计效率;在前述处理基础上,采用逐层分类方法分析数据表,并从多个维度进行统计分析,自动化生成个人信息披露情况结果报表,从而全面完整地刻画平台的个人信息披露情况。

    一种半结构化数据中个人标识信息识别方法与系统

    公开(公告)号:CN117827991B

    公开(公告)日:2024-05-31

    申请号:CN202410253586.6

    申请日:2024-03-06

    Abstract: 本发明涉及信息安全技术领域,尤其涉及一种半结构化数据中个人标识信息识别方法与系统。该方法包括数据表读取和识别结果汇总保存,还包括数据预处理和靶向识别,所述数据预处理即将待识别的数据表按字段拆分为包含字段名、字段数据类型的字段描述信息和字段实际记录信息的单个字段,所述靶向识别包括预设模板识别和最小覆盖识别。本发明能够高效的对其中包含的个人标记信息进行识别,帮助相关从业人员了解数据表中的个人信息情况。

    面向数据开放的高性能个人信息脱敏方法与系统

    公开(公告)号:CN117708883A

    公开(公告)日:2024-03-15

    申请号:CN202410153939.5

    申请日:2024-02-04

    Abstract: 本发明涉及信息安全技术领域,尤其涉及一种面向数据开放的高性能个人信息脱敏方法与系统。该方法包括通过待脱敏数据获取,确认需要识别的个人信息类型及其识别规则,并确认对应的个人信息类型在进行脱敏处理时的脱敏策略,个人信息识别与定位和对识别到的承载个人信息的字符进行自适应脱敏处理,并根据字符定位在副本数据表中完成替换。通过本发明的脱敏方法和系统实现的面向数据开放的个人信息脱敏处理,可兼顾个人信息保护和数据开放场景下数据的真实性和可用性。

    一种多重校验身份证号码检测方法及生成方法

    公开(公告)号:CN116302671A

    公开(公告)日:2023-06-23

    申请号:CN202310257240.9

    申请日:2023-03-17

    Abstract: 本方案公开了一种多重校验身份证号码检测方法及生成方法,首先对输入的待检测文本提取号码和限定条件,然后通过以下多重校验方法校验所提取号码是否为身份证号,能够实现高精准的身份证号码提取与校验,同时也能校验给定的信息与识别到的号码是否匹配,适应在不同场景下身份证号码的识别工作;多重检测方法中包含了目前最简单的格式检测和校验码检测,包含了限定条件的提取和与提取号码的相互验证校验,既能够对身份证号进行准确性判断,又能够对限定条件对应的基本信息进行验证判断,提高待检测文本整体上的准确性。

Patent Agency Ranking