一种基于联合学习模型的细粒度数值信息抽取方法

    公开(公告)号:CN111309849A

    公开(公告)日:2020-06-19

    申请号:CN202010083902.1

    申请日:2020-02-10

    Applicant: 南京大学

    Abstract: 本发明公开了利用一种基于联合学习模型的细粒度数值信息抽取方法,包括如下步骤:对输入文本进行预处理;根据数值相关正则表达式识别候选的数值,以数值为触发词,与其前后词例拼接,作为联合学习模型的输入;联合学习模型的底层接入词嵌入层,并对词嵌入层的输出加入数值触发词的位置信息,得到每个词例最终的分布式表示;基于分布式表示接入后续的特征提取网络,并在高层分别接入具体任务的网络:接入分类网络得到数值信息的语义类型,接入序列标注网络得到数值触发词相关的数个语义角色;合并具体任务的输出得到数值信息单元;针对多个数值信息单元,基于统计方法判断它们之间的复合关系。本发明无需人工设计特征、准确性高、泛化能力强。

    一种基于联合学习模型的细粒度数值信息抽取方法

    公开(公告)号:CN111309849B

    公开(公告)日:2023-06-23

    申请号:CN202010083902.1

    申请日:2020-02-10

    Applicant: 南京大学

    Abstract: 本发明公开了利用一种基于联合学习模型的细粒度数值信息抽取方法,包括如下步骤:对输入文本进行预处理;根据数值相关正则表达式识别候选的数值,以数值为触发词,与其前后词例拼接,作为联合学习模型的输入;联合学习模型的底层接入词嵌入层,并对词嵌入层的输出加入数值触发词的位置信息,得到每个词例最终的分布式表示;基于分布式表示接入后续的特征提取网络,并在高层分别接入具体任务的网络:接入分类网络得到数值信息的语义类型,接入序列标注网络得到数值触发词相关的数个语义角色;合并具体任务的输出得到数值信息单元;针对多个数值信息单元,基于统计方法判断它们之间的复合关系。本发明无需人工设计特征、准确性高、泛化能力强。

Patent Agency Ranking