一种基于范例学习的文本摘要生成框架系统及方法

    公开(公告)号:CN113673241B

    公开(公告)日:2024-04-09

    申请号:CN202110885791.0

    申请日:2021-08-03

    Abstract: 本发明公开了一种基于范例学习的文本摘要生成框架及方法,允许在摘要生成的过程中参考一些写作范例,框架包括检索和生成两个阶段,检索阶段,给定一个文本,使用对比学习去数据库中检索一些范例,假定越好的摘要在语义空间应该和原文离得更近,检索器的模型使用了孪生网络的结构;生成阶段,提出了一种结合范例进行摘要生成的方法,可以方便的加在目前所有主流的条件生成模型上,为了更好的学习范例,将待生成的摘要和范例摘要按照句子对齐;通过训练好的模型进行预测,即解码阶段,使用集束搜索算法并鼓励那些和范例更相似的束。

    一种基于对比学习区分对话摘要与对话者的方法

    公开(公告)号:CN116245113A

    公开(公告)日:2023-06-09

    申请号:CN202111476754.0

    申请日:2021-12-06

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于对比学习区分对话摘要与对话者的方法,其特征在于,首先基于BART构建增强序列到序列的神经网络模型,该神经网络模型的编码器‑解码器能够对对话进行编码解码;然后基于训练时生成的训练用对话摘要与目标摘要的交叉熵损失以及采用三种对比学习任务辅助神经网络模型对训练用对话进行对话编码时的对比学习损失,对该神经网络模型进行训练直至生成能够根据对话者来区分对话从而生成摘要的对话者区分模型;由于采用了三种对比学习任务来辅助编码器进行对话编码,因此使得本发明的模型能够更好地理解对话数据,令生成摘要取得了更高的准确率,避免了事实一致性错误。

    一种基于范例学习的文本摘要生成框架及方法

    公开(公告)号:CN113673241A

    公开(公告)日:2021-11-19

    申请号:CN202110885791.0

    申请日:2021-08-03

    Abstract: 本发明公开了一种基于范例学习的文本摘要生成框架及方法,允许在摘要生成的过程中参考一些写作范例,框架包括检索和生成两个阶段,检索阶段,给定一个文本,使用对比学习去数据库中检索一些范例,假定越好的摘要在语义空间应该和原文离得更近,检索器的模型使用了孪生网络的结构;生成阶段,提出了一种结合范例进行摘要生成的方法,可以方便的加在目前所有主流的条件生成模型上,为了更好的学习范例,将待生成的摘要和范例摘要按照句子对齐;通过训练好的模型进行预测,即解码阶段,使用集束搜索算法并鼓励那些和范例更相似的束。

    基于不确定成分的中文命名实体识别检索增强框架

    公开(公告)号:CN116663559A

    公开(公告)日:2023-08-29

    申请号:CN202210147274.8

    申请日:2022-02-17

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于不确定成分的中文命名实体识别检索增强框架,由于包括命名实体识别模型,能够对输入的中文序列进行不确定成分采样,并基于采样得到的实体集不确定成分进行检索,因此相较于传统的依赖于词典的方法,能够有效地检索得到所需的知识序列,且无需花费高昂的代价进行高质量词典的构建以及动态维护,节省了大量算力,进一步,由于包括知识融合模型,能够基于检索得到的知识序列进行中文命名实体的识别预测,因此能够通过知识序列消除识别过程中的歧义,得到更为准确的预测结果,且相较于传统的采用遍历策略进行检测的方法,效率更高。综上所述,通过本发明的增强框架,能高效地得到准确的中文命名实体识别结果,且能节省大量算力。

Patent Agency Ranking