一种基于规则的通用文本信息抽取和信息生成方法

    公开(公告)号:CN110059176B

    公开(公告)日:2021-07-13

    申请号:CN201910153119.5

    申请日:2019-02-28

    Applicant: 南京大学

    Inventor: 骆斌 卢坚 伏晓

    Abstract: 本发明提供了一种基于规则的通用文本信息抽取和信息生成方法,包括:初始化信息字典上下文、规则词包、规则引擎与模板引擎;对文本进行信息标注;定义信息抽取算法和编写规则脚本代码;生成规则依赖有向图;执行文本抽取规则并根据抽取准确度进行微调;定义信息生成元模板;自定义模板规则选取与文本生成。本发明实现了抽取规则模块化,提高了抽取规则的共享可能性,能够对复杂文本信息的结构进行很好的分析挖掘,极大地提高了抽取信息与外部信息生成文本的效率,特别适用于法律文书等需要大量信息文本进行信息抽取和生成的领域。本发明方法能够显著提高文本抽取效率和准确度、优化文本抽取复杂度以及提高信息文本生成效率。

    一种基于规则的通用文本信息抽取和信息生成方法

    公开(公告)号:CN110059176A

    公开(公告)日:2019-07-26

    申请号:CN201910153119.5

    申请日:2019-02-28

    Applicant: 南京大学

    Inventor: 骆斌 卢坚 伏晓

    Abstract: 本发明提供了一种基于规则的通用文本信息抽取和信息生成方法,包括:初始化信息字典上下文、规则词包、规则引擎与模板引擎;对文本进行信息标注;定义信息抽取算法和编写规则脚本代码;生成规则依赖有向图;执行文本抽取规则并根据抽取准确度进行微调;定义信息生成元模板;自定义模板规则选取与文本生成。本发明实现了抽取规则模块化,提高了抽取规则的共享可能性,能够对复杂文本信息的结构进行很好的分析挖掘,极大地提高了抽取信息与外部信息生成文本的效率,特别适用于法律文书等需要大量信息文本进行信息抽取和生成的领域。本发明方法能够显著提高文本抽取效率和准确度、优化文本抽取复杂度以及提高信息文本生成效率。

Patent Agency Ranking