-
公开(公告)号:CN114064901B
公开(公告)日:2022-08-26
申请号:CN202111422577.8
申请日:2021-11-26
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F16/36 , G06F16/951 , G06F40/205 , G06F40/289 , G06F40/30 , G06F40/247 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于知识图谱词义消歧的书评文本分类方法,属于自然语言处理技术领域。该方法包括:S1:获取书评文本数据集;S2:将文本进行分段处理;S3:对分段后的文本进行聚类并标签化,每个文本片段对应各自的外部知识实体;S4:词级文本预处理;S5:计算词级文本间的语义相似度、余弦相似度、目标函数以及得分;S6:提取文本片段的特征;S7:利用层次注意力网络提取各文本片段的特征信息,再对文本片段的特征信息进行一次层次注意力网路的文本处理,最终得到的特征信息经归一化处理完成文本分类。本发明能有效处理篇章级别的长文本数据。
-
公开(公告)号:CN114064901A
公开(公告)日:2022-02-18
申请号:CN202111422577.8
申请日:2021-11-26
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F16/36 , G06F16/951 , G06F40/205 , G06F40/289 , G06F40/30 , G06F40/247 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于知识图谱词义消歧的书评文本分类方法,属于自然语言处理技术领域。该方法包括:S1:获取书评文本数据集;S2:将文本进行分段处理;S3:对分段后的文本进行聚类并标签化,每个文本片段对应各自的外部知识实体;S4:词级文本预处理;S5:计算词级文本间的语义相似度、余弦相似度、目标函数以及得分;S6:提取文本片段的特征;S7:利用层次注意力网络提取各文本片段的特征信息,再对文本片段的特征信息进行一次层次注意力网路的文本处理,最终得到的特征信息经归一化处理完成文本分类。本发明能有效处理篇章级别的长文本数据。
-