一种基于深度学习混合模型的争议焦点检测方法及装置

    公开(公告)号:CN112613582B

    公开(公告)日:2022-06-24

    申请号:CN202110007332.2

    申请日:2021-01-05

    Abstract: 本发明涉及一种基于深度学习混合模型的争议焦点检测方法及装置,属于自然语言处理领域。该方法包括以下步骤:①构建争议焦点树库;②完成数据的标注并得到数据集;③得到完整可训练的数据集;④将步骤S3得到的数据集进行中文数据预处理;⑤利用BERT‑wwm模型得到文本字向量矩阵;⑥使用LSTM网络模型提取文本全局语义特征;使用TextCNN模型的多种卷积核提取文本不同粒度的局部语义特征;将两个模型的概率结果进行平均计算,设定阈值进行预测,输出概率超过阈值的争议焦点。本发明针对单模型不能同时捕捉并利用多层面语义特征的问题,提供了一种混合模型的争议焦点预测方法,大大提升了预测精度。

    一种基于深度学习混合模型的争议焦点检测方法及装置

    公开(公告)号:CN112613582A

    公开(公告)日:2021-04-06

    申请号:CN202110007332.2

    申请日:2021-01-05

    Abstract: 本发明涉及一种基于深度学习混合模型的争议焦点检测方法及装置,属于自然语言处理领域。该方法包括以下步骤:①构建争议焦点树库;②完成数据的标注并得到数据集;③得到完整可训练的数据集;④将步骤S3得到的数据集进行中文数据预处理;⑤利用BERT‑wwm模型得到文本字向量矩阵;⑥使用LSTM网络模型提取文本全局语义特征;使用TextCNN模型的多种卷积核提取文本不同粒度的局部语义特征;将两个模型的概率结果进行平均计算,设定阈值进行预测,输出概率超过阈值的争议焦点。本发明针对单模型不能同时捕捉并利用多层面语义特征的问题,提供了一种混合模型的争议焦点预测方法,大大提升了预测精度。

Patent Agency Ranking