-
公开(公告)号:CN113688634B
公开(公告)日:2022-02-11
申请号:CN202110945239.6
申请日:2021-08-17
Applicant: 中国矿业大学(北京)
IPC: G06F40/30 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种细粒度情感分析方法,涉及自然语言处理领域。该方法包括以下步骤:为数据集中每条样本生成序列标签和位置嵌入向量、添加“ ”和“ ”标志以标识样本的首尾、添加标签“ ”以补齐样本长度,之后将样本通过词典转化为整数编码序列,输入bert模型生成样本的嵌入向量;搭建实体数量预测模型、实体起始位置标注模型和实体长度预测模型,并将样本分别输入三个模型进行训练,完成评价对象提取(OTE);搭建情感预测模型,并将样本输入该模型进行训练,完成情感极性分析(OSC);顺次连接以上训练完毕的四个模型,输入待预测样本,抽取评价对象并分析评价对象的情感极性。本发明可用于抽取评论文本中的评价对象及对其进行情感分析。
-
公开(公告)号:CN113688634A
公开(公告)日:2021-11-23
申请号:CN202110945239.6
申请日:2021-08-17
Applicant: 中国矿业大学(北京)
IPC: G06F40/30 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种细粒度情感分析方法,涉及自然语言处理领域。该方法包括以下步骤:为数据集中每条样本生成序列标签和位置嵌入向量、添加“ ”和“ ”标志以标识样本的首尾、添加标签“ ”以补齐样本长度,之后将样本通过词典转化为整数编码序列,输入bert模型生成样本的嵌入向量;搭建实体数量预测模型、实体起始位置标注模型和实体长度预测模型,并将样本分别输入三个模型进行训练,完成评价对象提取(OTE);搭建情感预测模型,并将样本输入该模型进行训练,完成情感极性分析(OSC);顺次连接以上训练完毕的四个模型,输入待预测样本,抽取评价对象并分析评价对象的情感极性。本发明可用于抽取评论文本中的评价对象及对其进行情感分析。
-