-
公开(公告)号:CN117332039B
公开(公告)日:2024-07-02
申请号:CN202311218607.2
申请日:2023-09-20
Applicant: 鹏城实验室
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本申请实施例提供文本检测方法、装置、设备和存储介质,涉及人工智能技术领域。该方法包括:利用预设检测词表初步将包含敏感词的检测文本筛选出来,再利用多个安全检测模型对初筛后的检测文本更细粒度的合规性判断,得到表征合规性的检测得分,这里检测得分越高表征检测文段的安全性越高。在后续检测过程中,本实施例并不仅简单地将所有检测文段的检测得分通过作为合规性结果,而是预留一定的冗余,虽然一些检测文段的检测得分没有通过,但是其数量较少,则也可以认为其合规。通过多阶段检测,从粗粒度到细粒度进行合规判断,能够在整体上降低检测文本被误检的概率。
-
公开(公告)号:CN117313695A
公开(公告)日:2023-12-29
申请号:CN202311138419.9
申请日:2023-09-01
Applicant: 鹏城实验室
IPC: G06F40/205 , G06F40/237 , G06F16/901 , G06F16/903 , G06F16/35 , G06F21/62
Abstract: 本申请实施例提供了一种文本敏感性检测方法、装置、电子设备及计算机可读存储介质,属于智能识别技术领域。该方法包括:获取待检测文本内容;对待检测文本内容进行脱敏处理得到多个脱敏文本;根据预设的AC自动机对各个脱敏文本进行匹配处理,在脱敏文本匹配为独立性敏感文本的情况下,根据预训练的上下文敏感信息检测模型对相应的脱敏文本进行检测处理得到检测结果;在检测结果表征对应的脱敏文本为上下文敏感文本的情况下,对脱敏文本进行屏蔽处理;在检测结果表征对应的脱敏文本不为上下文敏感文本的情况下,输出脱敏文本。本申请实施例使得文本敏感性检测的过程更加稳定可靠。
-
公开(公告)号:CN117313695B
公开(公告)日:2024-07-30
申请号:CN202311138419.9
申请日:2023-09-01
Applicant: 鹏城实验室
IPC: G06F40/205 , G06F40/237 , G06F16/901 , G06F16/903 , G06F16/35 , G06F21/62
Abstract: 本申请实施例提供了一种文本敏感性检测方法、装置、电子设备及计算机可读存储介质,属于智能识别技术领域。该方法包括:获取待检测文本内容;对待检测文本内容进行脱敏处理得到多个脱敏文本;根据预设的AC自动机对各个脱敏文本进行匹配处理,在脱敏文本匹配为独立性敏感文本的情况下,根据预训练的上下文敏感信息检测模型对相应的脱敏文本进行检测处理得到检测结果;在检测结果表征对应的脱敏文本为上下文敏感文本的情况下,对脱敏文本进行屏蔽处理;在检测结果表征对应的脱敏文本不为上下文敏感文本的情况下,输出脱敏文本。本申请实施例使得文本敏感性检测的过程更加稳定可靠。
-
公开(公告)号:CN117332039A
公开(公告)日:2024-01-02
申请号:CN202311218607.2
申请日:2023-09-20
Applicant: 鹏城实验室
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本申请实施例提供文本检测方法、装置、设备和存储介质,涉及人工智能技术领域。该方法包括:利用预设检测词表初步将包含敏感词的检测文本筛选出来,再利用多个安全检测模型对初筛后的检测文本更细粒度的合规性判断,得到表征合规性的检测得分,这里检测得分越高表征检测文段的安全性越高。在后续检测过程中,本实施例并不仅简单地将所有检测文段的检测得分通过作为合规性结果,而是预留一定的冗余,虽然一些检测文段的检测得分没有通过,但是其数量较少,则也可以认为其合规。通过多阶段检测,从粗粒度到细粒度进行合规判断,能够在整体上降低检测文本被误检的概率。
-
-
-