一种地理学科领域命名实体识别方法

    公开(公告)号:CN107133220B

    公开(公告)日:2020-11-24

    申请号:CN201710422919.3

    申请日:2017-06-07

    Applicant: 东南大学

    Inventor: 李慧颖 徐飞飞

    Abstract: 本发明公开了一种地理学科领域命名实体识别方法,识别出地理学科核心术语类和地理区域位置类实体,主要包括三个步骤:(1)地理学科领域词典构建,采用新词发现算法无监督地识别出地理学科领域新词。(2)基于条件随机场(CRF)模型和多通道卷积神经网络(MCCNN)模型进行训练与测试。(3)基于规则的方法,纠错和融合模型识别出的实体。本发明采用新词发现算法无监督识别领域新词作为词典,以提高分词效果。从大规模未标注数据中无监督地学习词的语义向量,并综合词的基础特征,作为MCCNN模型的输入特征,避免了手动选取和构建特征。自定义规则融合两种模型的预测结果,纠正识别过程中的错误标记问题。

    一种地理学科领域命名实体识别方法

    公开(公告)号:CN107133220A

    公开(公告)日:2017-09-05

    申请号:CN201710422919.3

    申请日:2017-06-07

    Applicant: 东南大学

    Inventor: 李慧颖 徐飞飞

    Abstract: 本发明公开了一种地理学科领域命名实体识别方法,识别出地理学科核心术语类和地理区域位置类实体,主要包括三个步骤:(1)地理学科领域词典构建,采用新词发现算法无监督地识别出地理学科领域新词。(2)基于条件随机场(CRF)模型和多通道卷积神经网络(MCCNN)模型进行训练与测试。(3)基于规则的方法,纠错和融合模型识别出的实体。本发明采用新词发现算法无监督识别领域新词作为词典,以提高分词效果。从大规模未标注数据中无监督地学习词的语义向量,并综合词的基础特征,作为MCCNN模型的输入特征,避免了手动选取和构建特征。自定义规则融合两种模型的预测结果,纠正识别过程中的错误标记问题。

Patent Agency Ranking