-
公开(公告)号:CN112507723B
公开(公告)日:2024-06-18
申请号:CN202011400913.4
申请日:2020-12-03
Applicant: 南京理工大学
IPC: G06F40/30 , G06F40/295 , G06F16/951 , G06N3/0442 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了一种基于多模型融合的新闻情感分析方法,包括:爬取官方新闻网站相关英文新闻,得到原始新闻语料库;对爬取到的英文新闻文本进行预处理;根据预处理后的新闻语料库中的英文新闻文本信息,建立实体知识库,并利用实体知识库对英文新闻文本进行情感倾向标注,并将标注为情感句的英文新闻文本分为三级进行标注;利用三级标注后的英文新闻文本对情感分析模型进行训练,使其具备将预处理后的英文新闻文本进行三级分类的功能;将标注为情感句的英文新闻句输入训练好的情感分析模型,获得分类结果。本发明在保持几乎相同准确率的同时更节约网络训练时间、提高了效率。
-
公开(公告)号:CN112507723A
公开(公告)日:2021-03-16
申请号:CN202011400913.4
申请日:2020-12-03
Applicant: 南京理工大学
IPC: G06F40/30 , G06F40/295 , G06F16/951 , G06N3/04
Abstract: 本发明公开了一种基于多模型融合的新闻情感分析方法,包括:爬取官方新闻网站相关英文新闻,得到原始新闻语料库;对爬取到的英文新闻文本进行预处理;根据预处理后的新闻语料库中的英文新闻文本信息,建立实体知识库,并利用实体知识库对英文新闻文本进行情感倾向标注,并将标注为情感句的英文新闻文本分为三级进行标注;利用三级标注后的英文新闻文本对情感分析模型进行训练,使其具备将预处理后的英文新闻文本进行三级分类的功能;将标注为情感句的英文新闻句输入训练好的情感分析模型,获得分类结果。本发明在保持几乎相同准确率的同时更节约网络训练时间、提高了效率。
-
公开(公告)号:CN112784602B
公开(公告)日:2024-06-14
申请号:CN202011395972.7
申请日:2020-12-03
Applicant: 南京理工大学
IPC: G06F40/295 , G06F40/30 , G06F16/951 , G06N3/0442 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种基于远程监督的新闻情感实体抽取方法,包括:爬取官方新闻网站新闻预料并缓存至本地仓库;对爬取的新闻语料进行预处理,获得切分成句的新闻预料;构建关键实体知识库,根据知识库对切分成句的新闻预料进行自动标注;利用标注了的新闻预料对情感句抽取模型进行训练使其具备对输入句子进行自动情感判断的能力;利用抽取出的情感句,将情感句作为情感实体抽取模型的训练集进行训练;爬取新闻语料并切分成句,将切分成句的新闻语料输入训练好的情感句抽取模型抽取情感句,并将抽取的情感句输入训练好的情感实体抽取模型,获得情感实体。本发明采用远程监督的方式为大量样本生成带噪声的数据集供模型训练,提高了模型训练的效率。
-
公开(公告)号:CN112784602A
公开(公告)日:2021-05-11
申请号:CN202011395972.7
申请日:2020-12-03
Applicant: 南京理工大学
IPC: G06F40/295 , G06F40/30 , G06F16/951 , G06N3/04
Abstract: 本发明公开了一种基于远程监督的新闻情感实体抽取方法,包括:爬取官方新闻网站新闻预料并缓存至本地仓库;对爬取的新闻语料进行预处理,获得切分成句的新闻预料;构建关键实体知识库,根据知识库对切分成句的新闻预料进行自动标注;利用标注了的新闻预料对情感句抽取模型进行训练使其具备对输入句子进行自动情感判断的能力;利用抽取出的情感句,将情感句作为情感实体抽取模型的训练集进行训练;爬取新闻语料并切分成句,将切分成句的新闻语料输入训练好的情感句抽取模型抽取情感句,并将抽取的情感句输入训练好的情感实体抽取模型,获得情感实体。本发明采用远程监督的方式为大量样本生成带噪声的数据集供模型训练,提高了模型训练的效率。
-
-
-