一种基于多模态信息特征的不良内容过滤方法

    公开(公告)号:CN109902223B

    公开(公告)日:2020-12-04

    申请号:CN201910032064.2

    申请日:2019-01-14

    Abstract: 本发明提出了一种基于多模态信息特征的不良内容过滤方法,将文本集划分为训练集与测试集,将分词结果和关键词输入到分类算法,提取文本特征,训练分类器;将训练好的分类器用于预测测试集,得到文本分类结果;将文本集和关键词集转为图像数据,将数据图像集与文本集相对应,划分为对应的训练集与测试集,进行相似度计算,得到相似度最大值集合以及最大值对应的关键词集合,如果该关键词集合的关键词满足阈值约束,则匹配成功,则该关键词为相似度最大值对应的关键词,作为图像分类结果;对比文本分类结果与图像分类结果,根据判别条件得到最终的类别预测结果,以过滤该不良内容。

    一种基于多模态信息特征的不良内容过滤方法

    公开(公告)号:CN109902223A

    公开(公告)日:2019-06-18

    申请号:CN201910032064.2

    申请日:2019-01-14

    Abstract: 本发明提出了一种基于多模态信息特征的不良内容过滤方法,将本文集划分为训练集与测试集,将分词结果和关键词输入到分类算法,提取文本特征,训练分类器;将训练好的分类器用于预测测试集,得到文本分类结果;将文本集和关键词集转为图像数据,将数据图像集与文本集相对应,划分为对应的训练集与测试集,进行相似度计算,得到相似度最大值集合以及最大值对应的关键词集合,如果该关键词集合的关键词满足阈值约束,则匹配成功,则该关键词为相似度最大值对应的关键词,作为图像分类结果;对比文本分类结果与图像分类结果,根据判别条件得到最终的类别预测结果,以过滤该不良内容。

Patent Agency Ranking