文本细粒度情感分类方法、系统、装置及存储介质

    公开(公告)号:CN111914085A

    公开(公告)日:2020-11-10

    申请号:CN202010560649.4

    申请日:2020-06-18

    Abstract: 本发明公开了一种文本细粒度情感分类方法、系统、装置及存储介质,其中方法包括以下步骤:获取目标文本和属性词,对目标文本和属性词进行预处理,获得序列对;将序列对输入XLNet模型进行学习,并输出属性相关的词向量语义序列和全局特征表示;采用胶囊网络对词向量语义序列进行学习,获得包含局部特征及空间层次关系的局部特征表示;将全局特征表示和局部特征表示进行合并,获得目标文本的最终语义表示,根据最终语义表示对情感类别进行预测。本发明通过充分结合XLNet学习大规模文本的语义知识方面的优势,以及胶囊网络在学习文本序列的局部信息和空间结构信息方面的优势,提高情感分类的准确率,可广泛应用于自然语言处理领域。

    结合循环网络及BERT的句子相关度获取方法、系统及介质

    公开(公告)号:CN112163429B

    公开(公告)日:2023-08-29

    申请号:CN202011031042.3

    申请日:2020-09-27

    Abstract: 本发明公开了一种结合循环网络及BERT的句子相关度获取方法、系统及介质,其中方法包括:对待识别的两个句子进行分词,将句子合并成一个句子对,合并各个单词的位置词向量、单词词向量信息及分段信息作为BERT层的输入;通过BERT层学习句子及句子之间的上下文信息和关系,输出词向量语义序列和全局特征表示;对词向量语义序列进行学习,获得包含目标文本的局部特征表示;利用串联对句子的全局特征表示和局部特征表示进行合并,获得最终语义表示,根据最终语义表示对句子的相关度进行判断,并输出判断结果。本发明利用BERT学习句子间的上下文信息后,提取句子的局部信息,提高了句子相关度判别的精准度,可广泛应用于自然语言处理领域。

    结合循环网络及BERT的句子相关度获取方法、系统及介质

    公开(公告)号:CN112163429A

    公开(公告)日:2021-01-01

    申请号:CN202011031042.3

    申请日:2020-09-27

    Abstract: 本发明公开了一种结合循环网络及BERT的句子相关度获取方法、系统及介质,其中方法包括:对待识别的两个句子进行分词,将句子合并成一个句子对,合并各个单词的位置词向量、单词词向量信息及分段信息作为BERT层的输入;通过BERT层学习句子及句子之间的上下文信息和关系,输出词向量语义序列和全局特征表示;对词向量语义序列进行学习,获得包含目标文本的局部特征表示;利用串联对句子的全局特征表示和局部特征表示进行合并,获得最终语义表示,根据最终语义表示对句子的相关度进行判断,并输出判断结果。本发明利用BERT学习句子间的上下文信息后,提取句子的局部信息,提高了句子相关度判别的精准度,可广泛应用于自然语言处理领域。

    文本细粒度情感分类方法、系统、装置及存储介质

    公开(公告)号:CN111914085B

    公开(公告)日:2024-04-23

    申请号:CN202010560649.4

    申请日:2020-06-18

    Abstract: 本发明公开了一种文本细粒度情感分类方法、系统、装置及存储介质,其中方法包括以下步骤:获取目标文本和属性词,对目标文本和属性词进行预处理,获得序列对;将序列对输入XLNet模型进行学习,并输出属性相关的词向量语义序列和全局特征表示;采用胶囊网络对词向量语义序列进行学习,获得包含局部特征及空间层次关系的局部特征表示;将全局特征表示和局部特征表示进行合并,获得目标文本的最终语义表示,根据最终语义表示对情感类别进行预测。本发明通过充分结合XLNet学习大规模文本的语义知识方面的优势,以及胶囊网络在学习文本序列的局部信息和空间结构信息方面的优势,提高情感分类的准确率,可广泛应用于自然语言处理领域。

    一种基于RoBERTa和启发式算法的实体链接方法

    公开(公告)号:CN111125380B

    公开(公告)日:2023-04-21

    申请号:CN201911393144.7

    申请日:2019-12-30

    Abstract: 本发明公开的一种基于RoBERTa和启发式算法的实体链接方法,包含以下步骤:使用基于预训练语言模型RoBERTa的序列标注模型对问题进行标注,RoBERTa模型通过堆叠12层transformer结构以获取问题中多层次的语法语义信息;而transformer中通过多头注意力机制获取问题中每个单词基于上下文的动态表示,进而获取问题中的实体提及范围;获得实体提及范围后,使用一个启发式算法,直接将该实体提及与知识库实体进行匹配,完成实体链接。本发明可以应用到各种知识库问答的场景当中,为许多应高级用提供底层基础服务。

    一种基于RoBERTa和启发式算法的实体链接方法

    公开(公告)号:CN111125380A

    公开(公告)日:2020-05-08

    申请号:CN201911393144.7

    申请日:2019-12-30

    Abstract: 本发明公开的一种基于RoBERTa和启发式算法的实体链接方法,包含以下步骤:使用基于预训练语言模型RoBERTa的序列标注模型对问题进行标注,RoBERTa模型通过堆叠12层transformer结构以获取问题中多层次的语法语义信息;而transformer中通过多头注意力机制获取问题中每个单词基于上下文的动态表示,进而获取问题中的实体提及范围;获得实体提及范围后,使用一个启发式算法,直接将该实体提及与知识库实体进行匹配,完成实体链接。本发明可以应用到各种知识库问答的场景当中,为许多应高级用提供底层基础服务。

Patent Agency Ranking