-
公开(公告)号:CN114897078B
公开(公告)日:2024-11-08
申请号:CN202210544327.X
申请日:2022-05-19
Applicant: 辽宁大学
IPC: G06F18/22 , G06F18/25 , G06F18/2132 , G06F18/2415 , G06F40/284 , G06F40/30 , G06F16/35 , G06N3/0442 , G06N3/0464 , G06N3/045 , G06N3/082
Abstract: 基于深度学习和主题模型的短文本相似度计算方法,属于文本相似度匹配技术领域,要解决的问题是如何通过深度学习网络和LDA主题模型准确实现短文本相似度计算。首先使用BERT对输入模型的多段文本分别进行分词及向量转换,然后将分词后的词向量分别输入到深度学习模型和LDA主题模型。在深度学习模型内部,先利用双向LSTM网络提取单词的上下文信息;再利用1D卷积神经网络将上下文信息与词嵌入信息进行信息融合;最后使用全局最大池化提取关键信息。在LDA主题模型内部,采用吉布斯抽样进行主题提取,提取每段文本的感情色彩。根据两个模型提取到的特征,通过混合型文本语义相似度计算方法计算获得两段文本之间的相似度。
-
公开(公告)号:CN114897078A
公开(公告)日:2022-08-12
申请号:CN202210544327.X
申请日:2022-05-19
Applicant: 辽宁大学
Abstract: 基于深度学习和主题模型的短文本相似度计算方法,属于文本相似度匹配技术领域,要解决的问题是如何通过深度学习网络和LDA主题模型准确实现短文本相似度计算。首先使用BERT对输入模型的多段文本分别进行分词及向量转换,然后将分词后的词向量分别输入到深度学习模型和LDA主题模型。在深度学习模型内部,先利用双向LSTM网络提取单词的上下文信息;再利用1D卷积神经网络将上下文信息与词嵌入信息进行信息融合;最后使用全局最大池化提取关键信息。在LDA主题模型内部,采用吉布斯抽样进行主题提取,提取每段文本的感情色彩。根据两个模型提取到的特征,通过混合型文本语义相似度计算方法计算获得两段文本之间的相似度。
-
公开(公告)号:CN115730606A
公开(公告)日:2023-03-03
申请号:CN202211565870.4
申请日:2022-12-07
Applicant: 辽宁大学
IPC: G06F40/30 , G06F40/205 , G06F40/284 , G06N3/048
Abstract: 一种基于BERT模型和注意力集中网络的细粒度情感分析方法,通过结合BERT模型与注意力机制,构造了一种进行细粒度情感分析任务的模型。首先将待分析的句子及其方面词拼接为输入文本,使用BERT模型对输入文本进行语义信息整合,然后通过注意力机制构造一个注意力集中网络层,进行更深层次的信息提取,最后使用一个全连接层获取最终的情感分析预测结果。本方法实现了一种注意力集中网络,将句子与方面词的文本信息交互,然后使得注意力集中于句中对应方面的语义信息,并通过将其与BERT结合,使得模型有能力提取出细粒度情感分析任务文本中较深层次的语义,相较于各基线模型,成功地提高了细粒度情感分析结果的准确度和F1值指标。
-
-