一种属性抽取方法、装置及存储介质

    公开(公告)号:CN114817564A

    公开(公告)日:2022-07-29

    申请号:CN202210458635.0

    申请日:2022-04-15

    Applicant: 苏州大学

    Abstract: 本发明将属性抽取任务化为片段抽取式阅读理解任务,采用属性抽取与文本属性判断联合训练的多任务模型。模型以BERT‑B i‑LSTM作为编码模块,分别对输入文本与问题编码,将结构化信息作为问题来增强模型的泛化能力。然后使用词边界特征增强的方法以帮助模型捕获属性值的边界特征,结合多头注意力机制在全局向量特征的基础上融入词汇特征。同时,设计一种文本特征交互方法,用于判断文本中是否存在与问题对应的属性值,该方法作为辅助任务与属性值边界预测任务联合训练。

    基于商品评论命名实体识别的问题生成方法

    公开(公告)号:CN111738006A

    公开(公告)日:2020-10-02

    申请号:CN202010574339.8

    申请日:2020-06-22

    Applicant: 苏州大学

    Abstract: 本发明基于商品评论命名实体识别的问题生成方法,该模型首先将产品相关的信息实体加以标注,使得生成的问题与产品紧密相关。其次,利用基于复制覆盖机制的序列到序列模型,当词汇表中未收录该词时,选取原文词汇,这避免了脱离词典问题,使得生成的问句更加的通顺和灵活。最后,结合注意力机制,增加与产品相关词语的比重。本文使用产品评论数据进行实验,与目前的问题生成模型相比,基于商品评论的问题生成模型不仅生成的问题会更加的灵活通顺,而且更加符合本身产品的相关内容。

    一种基于配对信息增强的属性级情感三元组抽取方法

    公开(公告)号:CN118916446A

    公开(公告)日:2024-11-08

    申请号:CN202411390313.2

    申请日:2024-10-08

    Applicant: 苏州大学

    Inventor: 周夏冰 杨帆

    Abstract: 本发明公开了一种基于配对信息增强的属性级情感三元组抽取方法,涉及自然语言处理技术领域,包括获取包含用户评价的评论文本数据集;设计基于编码器‑解码器结构的属性级情感三元组生成基线模型;利用T5编码器将评论文本编码为隐藏表示,通过T5解码器生成属性级情感三元组;采用交叉熵损失函数计算三元组生成损失;执行多层次配对信息增强,利用配对层和情感层的对比学习计算配对层对比损失和情感层对比损失;结合三元组生成损失、配对层对比损失和情感层对比损失,构建综合损失函数并进行多任务联合训练。本发明采用T5模型,避免了传统非生成式方法中的误差传播问题,同时能够更深入地探索标签语义,提高了三元组抽取的整体质量。

    一种属性抽取方法、装置及存储介质

    公开(公告)号:CN114817564B

    公开(公告)日:2024-08-23

    申请号:CN202210458635.0

    申请日:2022-04-15

    Applicant: 苏州大学

    Abstract: 本发明将属性抽取任务化为片段抽取式阅读理解任务,采用属性抽取与文本属性判断联合训练的多任务模型。模型以BERT‑B i‑LSTM作为编码模块,分别对输入文本与问题编码,将结构化信息作为问题来增强模型的泛化能力。然后使用词边界特征增强的方法以帮助模型捕获属性值的边界特征,结合多头注意力机制在全局向量特征的基础上融入词汇特征。同时,设计一种文本特征交互方法,用于判断文本中是否存在与问题对应的属性值,该方法作为辅助任务与属性值边界预测任务联合训练。

Patent Agency Ranking