一种短文本相似度的计算方法及装置、可读存储介质

    公开(公告)号:CN110929498B

    公开(公告)日:2023-05-09

    申请号:CN201811117561.4

    申请日:2018-09-20

    Abstract: 本发明公开了一种短文本相似度的计算方法,该方法包括:获取待匹配文本和参考文本,并计算所述待匹配文本和所述参考文本之间的文本相似度;获取关联文档,并基于所述关联文档、所述待匹配文本和所述参考文本,计算得到所述待匹配文本和参考文本之间的逻辑关联度;其中,所述关联文档用于表征所述待匹配文本和参考文本之间的逻辑关系;基于所述待匹配文本和所述参考文本之间的文本相似度和逻辑关联度,确定所述待匹配文本对应的语义和所述参考文本对应的语义;基于所述待匹配文本对应的语义和所述参考文本对应的语义,计算得到所述待匹配文本和所述参考文本的相似度。本发明的实施例同时公开了一种短文本相似度计算装置和计算机存储介质。

    一种命名实体识别方法、装置及存储介质

    公开(公告)号:CN114638227B

    公开(公告)日:2025-01-10

    申请号:CN202011477961.3

    申请日:2020-12-15

    Abstract: 本发明公开了一种命名实体识别方法、装置及存储介质,包括:以token分别使用字和分词后的词两种方式使用BERT模型进行预训练;预训练完成后,分别利用输出部分Transformer最后一层,被隐层的token在最后一个隐藏层拼接token补充信息;在Transformer最后一层位置上面串接一个softmax分类层;分别获取基于字和基于词的每个token的分类概率之后,将基于词的每个token的分类概率转化为基于字的标签概率;根据基于字和基于词的分类概率,每个token取最高值作为该token的标签值。采用本发明,能够提高模型性能;捕捉到的是真正意义上的双向上下文信息;对实体槽位进行补充进行编码,合理利用。

    摘要生成方法及装置
    16.
    发明公开

    公开(公告)号:CN116932741A

    公开(公告)日:2023-10-24

    申请号:CN202210351256.1

    申请日:2022-04-02

    Abstract: 本申请公开了一种摘要生成方法及装置,涉及文本摘要技术领域。该摘要生成方法,包括:获取目标向量表示,目标向量表示是目标文本的向量表示;按照静态领域知识库中的描述向量表示与目标向量表示的匹配度从高到低的顺序,从静态领域知识库的描述向量表示中确定K个第一向量表示;从静态领域知识库中获取K个第一领域知识;根据所述K个第一领域知识以及每个所述第一领域知识与所述目标文本的匹配度,生成所述目标文本对应的摘要。上述方案,通过在静态领域知识库中检索匹配K个领域知识的第一向量表示,进而基于该向量表示进行摘要内容的生成,能够提高为目标文本匹配的领域知识的准确度,进而改善为目标文本生成的摘要的质量。

Patent Agency Ranking