-
公开(公告)号:CN114328451A
公开(公告)日:2022-04-12
申请号:CN202111584597.5
申请日:2021-12-21
Applicant: 航天信息股份有限公司
Abstract: 本发明提供一种基于机器学习的敏感信息库构建方法、装置及计算机可读存储介质,属于信息构建技术领域。本申请实施例所述方法通过采集原始信息,并对所述原始信息进行预处理,以获取文本信息;基于配置的规则策略对所述文本信息执行第一识别处理以甄别所述文本信息中的违规信息,通过利用经训练的机器学习模型对甄别的所述违规信息进行模型收敛锻炼,将违规视频、音频、字幕及相关注释或链接进行存储,以建立敏感信息数据库,使用本申请实施例所述基于机器学习的敏感信息库构建装置可以为内容生产者、内容运营人员提供为影视内容敏感信息库建立及扩充服务,解决现有通过人工编辑效率低下以及准确性欠佳的问题。