一种基于主题特征和隐式句子结构的事件抽取方法

    公开(公告)号:CN113901813A

    公开(公告)日:2022-01-07

    申请号:CN202111178364.5

    申请日:2021-10-09

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于主题特征和隐式句子结构的事件抽取方法,主要用于把含有事件信息的非结构化文本以结构化的形式呈现出来,在自动文摘、自动问答、信息检索等领域有着广泛的应用。本发明首先通过结合BERT和LDA获得文档的主题特征为句子级的事件抽取模型引入文档级的主题信息;其次抽取出BERT词嵌入表示中隐含的句法信息,并将该抽取过程与事件抽取进行联合建模,在避免了错误累积问题的同时为事件抽取引入重要的句法信息;最后模型使用基于Bi‑LSTM和级联式CRF的序列标注方法抽取单句中的多个触发词以及抽取实体在多个事件中的元素角色。

Patent Agency Ranking