一种基于词向量的诊断标准化方法及装置

    公开(公告)号:CN109697286A

    公开(公告)日:2019-04-30

    申请号:CN201811551703.8

    申请日:2018-12-18

    Abstract: 本发明公开了一种基于词向量的诊断标准化方法及装置,该方法包括:S1:获取待处理的诊断语句,对待处理的诊断语句进行分词处理,获取分词结果;S2:根据分词结果以及预构的相应模型,建立待处理的诊断语句的词向量、词信息量以及词性标注结果;S3:根据词向量、词信息量以及词性标注结果,分别计算待处理的诊断语句与标准库中相关标准诊断语句的相似度;S4:选取与待处理的诊断语句最相似的标准诊断语句作为诊断语句的标准化结果。本发明通过计算待处理的诊断语句与当前诊断最接近的标准诊断语句的语义相似度,选取与待处理的诊断语句相似度最高的标准诊断语句作为标准化结果,以及定期对相应模型进行更新,提高诊断标准化的正确率。

Patent Agency Ranking