一种嵌套命名实体识别方法、系统、计算机和存储介质

    公开(公告)号:CN113688631A

    公开(公告)日:2021-11-23

    申请号:CN202110764616.6

    申请日:2021-07-05

    Abstract: 本发明提供了一种嵌套命名实体识别方法、系统、计算机和存储介质,通过将待识别文本的第一文本词向量表示进行边界检测得到对应的边界词概率和边界文本向量表示,再采用条件随机场进行解码和标注得到第一实体识别结果,以及根据边界词概率和预设概率阈值判断边界文本向量表示中是否存在嵌套命名实体边界词,并在存在时,将相邻嵌套命名实体边界词之间的边界文本向量表示合并得到的第二文本词向量表示进行边界检测开始下一轮实体识别迭代,反之,停止迭代,将第一实体识别结果作为待识别文本的实体识别结果的方法,有效识别命名实体的边界且缩减了候选实体子序列的数目,有效降低命名实体的解码复杂度,进一步提高嵌套实体预测识别能力和实用性。

Patent Agency Ranking