一种临床术语标准化方法及装置、存储介质

    公开(公告)号:CN117556811A

    公开(公告)日:2024-02-13

    申请号:CN202310223053.9

    申请日:2023-03-09

    Abstract: 本申请公开了一种临床术语标准化方法及装置、存储介质,该方法包括:S1将临床术语原词输入标准词数量预测模型,得到对应的预测标准词数量;S2基于BERT‑CRF构建的关键词抽取检索模型与Jaccard文本相似度算法得到第一部分候选标准词;S3基于历史检索方法得到第二部分候选标准词,结合所述第一部分候选标准词与所述第二部分候选标准词,得到候选标准词集合;S4基于数据增强方法构建文本蕴含数据集,基于利用所述文本蕴含集训练得到的文本蕴含模型与所述预测标准词数量确定临床术语标准词。该方法能够有效的匹配临床术语原词对应的候选标准词,提高临床术语标准化任务的准确率。

Patent Agency Ranking