-
公开(公告)号:CN112487795A
公开(公告)日:2021-03-12
申请号:CN202011171055.0
申请日:2020-10-28
Applicant: 中国科学院信息工程研究所
IPC: G06F40/284 , G06F40/30 , G06N3/04
Abstract: 本发明实施例提供上下文讽刺检测方法、装置、电子设备及存储介质,该方法包括:对用户评论文本进行分析得到用户评论特征;将所述用户评论特征输入预设讽刺检测模型,得到讽刺检测结果;其中,所述预设讽刺检测模型是通过对带讽刺标签的用户评论样本特征和无标签的用户评论样本特征训练得到的。针对讽刺检测的特点设计了内容特征和上下文特征的用户评论特征,然后针对讽刺检测的实际业务场景特点选取了一种半监督学习方法,采用多次抽取与带讽刺标签的用户评论样本特征相等数量的无标记数据构建决策树,集成多棵决策树预测输入文本,节省了大量的数据标注工作,从而更符合真实应用场景,最终更好的实现上下文讽刺检测。