基于Bi-LSTM的不良文本检测方法及装置

    公开(公告)号:CN110321554A

    公开(公告)日:2019-10-11

    申请号:CN201910485402.8

    申请日:2019-06-03

    Abstract: 本发明公开了一种基于Bi-LSTM的不良文本检测方法,包括:获取文本数据,并对获取的文本数据进行类型标记;对文本数据进行预处理,组成训练集;通过训练集训练模型的参数,当Bi-LSTM双向循环神经网络模型产生的损失值迭代变化小于设定阈值不再降低,则终止Bi-LSTM双向循环神经网络模型的训练,得到训练好的Bi-LSTM双向循环神经网络模型;将待判定的文本数据预处理后输入训练好的Bi-LSTM双向循环神经网络模型,输出判定结果。本发明从全文整体性角度来对文本内容进行理解、检测并分类,无需人工制定关键词典,对文本内容进行分词处理,实现了简洁、高效、高召回率的不良文本内容检测。

Patent Agency Ranking