一种基于舆情大数据分析的多标签文本分类方法

    公开(公告)号:CN112487143B

    公开(公告)日:2022-11-18

    申请号:CN202011368536.0

    申请日:2020-11-30

    Abstract: 本发明属于自然语言处理的文本分类领域,具体涉及一种基于舆情大数据分析的多标签文本分类方法,该方法包括:获取高校文本数据,根据高校文本数据构建拓扑图;将拓扑图输入到训练好的多标签文本分类模型中,得到高校文本数据的分类结果;所述多标签文本分类模型包括图卷积神经网络GCN和注意力残差网络;本发明采用GCN图卷积网络解决了从高校新闻评论数据错综复杂的信息结构中提取信息的困难,通过词句分级层次的对高校文本语料提取特征,充分挖掘文本词与词,句与句之间的文字内涵,同时为模型训练加入更加丰富的语料信息,对特征引入基于注意力的类残差融合,进一步分解文本对标签预测的影响。

    一种O2O商铺食品安全监测方法

    公开(公告)号:CN112487145A

    公开(公告)日:2021-03-12

    申请号:CN202011383623.3

    申请日:2020-12-01

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种O2O商铺食品安全监测方法,包括:采用主动学习算法对用户历史评论文本数据进行标注,得到标注样本集L;根据标注样本集L构建词向量;将标注样本集L和词向量输入AT‑GRU模型中进行深度学习,输出店铺是否存在安全隐患以及具体的安全隐患;将标注样本集L输入ELECTRA模型进行微调,得到较精确的预测结果。本发明使用了预训练模型ELECTRA进行微调,不仅可以找到有食品安全隐患的店铺,并且使用基于注意力机制的AT‑GRU模型,可以进行细粒度预测,自动化地提取出具体的食品安全隐患。

    一种O2O商铺食品安全监测方法

    公开(公告)号:CN112487145B

    公开(公告)日:2022-07-29

    申请号:CN202011383623.3

    申请日:2020-12-01

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种O2O商铺食品安全监测方法,包括:采用主动学习算法对用户历史评论文本数据进行标注,得到标注样本集L;根据标注样本集L构建词向量;将标注样本集L和词向量输入AT‑GRU模型中进行深度学习,输出店铺是否存在安全隐患以及具体的安全隐患;将标注样本集L输入ELECTRA模型进行微调,得到较精确的预测结果。本发明使用了预训练模型ELECTRA进行微调,不仅可以找到有食品安全隐患的店铺,并且使用基于注意力机制的AT‑GRU模型,可以进行细粒度预测,自动化地提取出具体的食品安全隐患。

    一种基于舆情大数据分析的多标签文本分类方法

    公开(公告)号:CN112487143A

    公开(公告)日:2021-03-12

    申请号:CN202011368536.0

    申请日:2020-11-30

    Abstract: 本发明属于自然语言处理的文本分类领域,具体涉及一种基于舆情大数据分析的多标签文本分类方法,该方法包括:获取高校文本数据,根据高校文本数据构建拓扑图;将拓扑图输入到训练好的多标签文本分类模型中,得到高校文本数据的分类结果;所述多标签文本分类模型包括图卷积神经网络GCN和注意力残差网络;本发明采用GCN图卷积网络解决了从高校新闻评论数据错综复杂的信息结构中提取信息的困难,通过词句分级层次的对高校文本语料提取特征,充分挖掘文本词与词,句与句之间的文字内涵,同时为模型训练加入更加丰富的语料信息,对特征引入基于注意力的类残差融合,进一步分解文本对标签预测的影响。

Patent Agency Ranking