一种基于大规模语言模型的事件模板归纳方法和系统

    公开(公告)号:CN116450827A

    公开(公告)日:2023-07-18

    申请号:CN202310392962.5

    申请日:2023-04-13

    Abstract: 本发明公开了一种基于大规模语言模型的事件模板归纳方法和系统。该方法主要包含:基于上下文生成的文本概念化,基于置信度衡量的事件模板结构化和基于图的事件模板整合三个模块。具体的,基于上下文生成的文本概念化通过示例学习充分发挥大规模生成式预训练语言模型的生成能力和类比能力,将多样化的事件自然语言表达转换为统一的概念化事件模板语言;基于置信度衡量的事件模板结构化通过显著性、可靠性和一致性筛选概念化的事件类别和事件论元角色从而结构化事件模板语言;基于图的事件模板整合通过图分割聚类算法整合同一事件的分散事件模板。本发明能够在开放场景下有效发现高质量、高覆盖度的事件模板。

Patent Agency Ranking