命名实体识别方法、装置、电子设备及存储介质

    公开(公告)号:CN115640805A

    公开(公告)日:2023-01-24

    申请号:CN202211117555.5

    申请日:2022-09-14

    Abstract: 本发明提供一种命名实体识别方法、装置、电子设备及存储介质,其中命名实体识别方法包括:获取待识别医学文本及与待识别医学文本关联的医学图像;将医学文本及医学图像输入至命名实体识别模型的编码器,得到多层文本编码特征及多层图像编码特征;将多层文本编码特征及多层图像编码特征进行特征融合处理,得到目标融合特征;将目标融合特征输入至命名实体识别模型的解码器,得到实体识别结果。通过上述方法,利用双模态的命名实体识别模型进行命名实体识别,同时将不同层次的文本编码特征与图像编码特征进行融合,提高了实体识别的准确率。

    热点话题检测方法及装置

    公开(公告)号:CN109582783B

    公开(公告)日:2020-10-02

    申请号:CN201811260532.3

    申请日:2018-10-26

    Abstract: 本发明涉及计算机技术领域,具体涉及一种热点话题检测方法。本发明的热点话题检测方法包括:基于预设实体知识库提取目标文本的关键句作为目标文本的摘要;使用LSH算法计算摘要的文档指纹;基于KNN算法对文档指纹进行聚类分析以确定目标文本的话题类别。本发明的热点话题检测方法是基于实体知识库中的实体对目标文本的句子进行评估,根据评估结果提取目标文本关键句作为摘要,通过这种方式可以使得提取出的摘要能够与具体应用场景紧密结合的同时还能保留更多的话题信息,进而保证后续文档聚类的精度,实现高质量的话题检测功能。

    文本链接嵌入方法
    3.
    发明公开

    公开(公告)号:CN109408743A

    公开(公告)日:2019-03-01

    申请号:CN201810956003.0

    申请日:2018-08-21

    Abstract: 本发明涉及互联网文本分析技术领域,具体涉及一种文本链接嵌入方法,所述方法是根据预设的字符级特征向量进行向量拼接得出待检测文本的目标词条和知识实体库中实体的特征向量,然后计算实体和目标词条的特征向量相似度以找到与目标词条对应的相似实体,最后将所述相似实体对应的实体链接信息嵌入对应的目标词条以完成文本链接嵌入。本发明的文本链接嵌入方法通过将实体和目标词条转换成能够保留语义特征的特征向量,根据目标词条和实体的特征向量相似度判断目标词条与实体之间词义是否相似。这样一来,即使是在同义不同词的情况下,也能做到目标词条与实体的精准匹配,从而有效地避免出现实体漏检情况。

    热点话题检测方法及装置

    公开(公告)号:CN109582783A

    公开(公告)日:2019-04-05

    申请号:CN201811260532.3

    申请日:2018-10-26

    Abstract: 本发明涉及计算机技术领域,具体涉及一种热点话题检测方法。本发明的热点话题检测方法包括:基于预设实体知识库提取目标文本的关键句作为目标文本的摘要;使用LSH算法计算摘要的文档指纹;基于KNN算法对文档指纹进行聚类分析以确定目标文本的话题类别。本发明的热点话题检测方法是基于实体知识库中的实体对目标文本的句子进行评估,根据评估结果提取目标文本关键句作为摘要,通过这种方式可以使得提取出的摘要能够与具体应用场景紧密结合的同时还能保留更多的话题信息,进而保证后续文档聚类的精度,实现高质量的话题检测功能。

    文本链接嵌入方法
    5.
    发明授权

    公开(公告)号:CN109408743B

    公开(公告)日:2020-11-17

    申请号:CN201810956003.0

    申请日:2018-08-21

    Abstract: 本发明涉及互联网文本分析技术领域,具体涉及一种文本链接嵌入方法,所述方法是根据预设的字符级特征向量进行向量拼接得出待检测文本的目标词条和知识实体库中实体的特征向量,然后计算实体和目标词条的特征向量相似度以找到与目标词条对应的相似实体,最后将所述相似实体对应的实体链接信息嵌入对应的目标词条以完成文本链接嵌入。本发明的文本链接嵌入方法通过将实体和目标词条转换成能够保留语义特征的特征向量,根据目标词条和实体的特征向量相似度判断目标词条与实体之间词义是否相似。这样一来,即使是在同义不同词的情况下,也能做到目标词条与实体的精准匹配,从而有效地避免出现实体漏检情况。

Patent Agency Ranking