-
公开(公告)号:CN117009513A
公开(公告)日:2023-11-07
申请号:CN202310520002.2
申请日:2023-05-09
Applicant: 南京大学
IPC: G06F16/35 , G06N3/0455 , G06N3/0499 , G06F16/951 , G06F18/2415 , G06F18/27
Abstract: 本发明公开一种基于bert模型的事件细粒度舆情分析方法,涉及自然语言处理情感分析领域。具体包括以下步骤:数据获取步骤,用python爬虫采用网络爬虫的方式对微博平台上包含特定关键词的微博信息进行采集包含关键词的微博信息,并将数据存储到TIDB数据库中;使用基于损失分布指导的标签噪声判别与平滑方法,缓解标注噪声对模型的误导;构建情感分析模型,通过领域偏离度修正注意力机制,将先验知识与模型有机结合,从而学习生成一个中文微博文本细粒度分类模型WEBERT,实现中文文本情感六分类;最后将预测的结果输入到双重差分模型中。本发明能帮助研究人员进行快捷且有效的情感分析,在有限的时间内构建有效的分析流程。
-
公开(公告)号:CN116522955A
公开(公告)日:2023-08-01
申请号:CN202310495967.0
申请日:2023-05-05
Applicant: 南京大学
Inventor: 周彦宇
IPC: G06F40/30 , G06F40/232 , G06F40/126 , G06N3/044 , G06N3/0464 , G06N3/0455 , G06N3/08 , G06F18/25 , G06F18/24 , G06F40/284
Abstract: 本发明公开了一种基于模态特征的方面级细粒度情感分析方法,涉及自然语言处理情感分析领域,具体包括以下模块:文本容错模块,针对文本输入信道不可靠带来的语义理解的问题;图文相关度匹配模块,针对输入图文匹配度有限带来的特征融合噪声问题,提出一种多模态相似度判别器方法,可以有效地解决输入图文匹配度有限所带来的特征融合噪声问题;损失函数设计,设计了基于先验调整的损失函数,并提出基于高斯混合模型的噪声数据标签平滑方法,采用高斯混合模型来建模数据中的噪声分布;注意力改进模块,根据输入序列的领域偏离度自适应地修正注意力计算,可以根据输入序列的领域偏离度进行修正,通过控制词间信息交互来降低领域偏移带来的影响。
-