基于混合对比学习和生成式数据增强的零样本文本立场检测方法

    公开(公告)号:CN115758159B

    公开(公告)日:2023-07-21

    申请号:CN202211517007.1

    申请日:2022-11-29

    Inventor: 李洋 袁嘉伟

    Abstract: 基于混合对比学习和生成式数据增强的零样本文本立场检测方法,本发明涉及零样本文本立场检测方法。本发明的目的是为了解决在结构化数据生成文本上,现有模型对表格数据进行建模时,没有考虑数据之间的内在隐含关系,导致文本生成准确率低的问题。过程为:一、获取可见类样本数据和不可见类样本数据;可见类样本数据和不可见类样本数据均为带标签数据;可见类样本数据和不可见类样本数据的目标不同;可见类样本数据作为训练集;不可见类样本数据作为测试集;训练集和测试集包括目标、立场、真实文本;二、建立GDA‑CL模型,模型包括:文本生成层、对比学习层、立场分类层。本发明用于人工智能、自然语言处理、文本生成技术领域。

    基于混合对比学习和生成式数据增强的零样本文本立场检测方法

    公开(公告)号:CN115758159A

    公开(公告)日:2023-03-07

    申请号:CN202211517007.1

    申请日:2022-11-29

    Inventor: 李洋 袁嘉伟

    Abstract: 基于混合对比学习和生成式数据增强的零样本文本立场检测方法,本发明涉及零样本文本立场检测方法。本发明的目的是为了解决在结构化数据生成文本上,现有模型对表格数据进行建模时,没有考虑数据之间的内在隐含关系,导致文本生成准确率低的问题。过程为:一、获取可见类样本数据和不可见类样本数据;可见类样本数据和不可见类样本数据均为带标签数据;可见类样本数据和不可见类样本数据的目标不同;可见类样本数据作为训练集;不可见类样本数据作为测试集;训练集和测试集包括目标、立场、真实文本;二、建立GDA‑CL模型,模型包括:文本生成层、对比学习层、立场分类层。本发明用于人工智能、自然语言处理、文本生成技术领域。

Patent Agency Ranking