一种基于融合字形信息的服药单识别结果纠错方法

    公开(公告)号:CN112613522B

    公开(公告)日:2023-03-14

    申请号:CN202110015403.3

    申请日:2021-01-04

    Abstract: 本发明涉及一种基于融合字形信息的服药单识别结果纠错方法,属于文字识别领域,包括构建一个标准药品词库,将词库中的每个药品信息作为一个节点存储在BK树内存结构中,设置搜索距离阈值n,通过阈值搜索规则减少数据搜索规模,得到结果候选集;将文字识别后待纠错字符串与结果候选集中的字符串进行相似度匹配,在原有的相似度匹配方案基础上改进传统的编辑距离公式,保持插入和删除操作代价不变,降低替换字符代价;在进行替换字符操作时,考虑字符的五笔编码、四角码和笔画三个字形相关信息,增大字符串近似匹配精度;将相似度最高的字符串作为纠错结果进行替换。本发明通过对服药单识别结果纠错,提高服药单识别准确率。

    一种基于融合字形信息的服药单识别结果纠错方法

    公开(公告)号:CN112613522A

    公开(公告)日:2021-04-06

    申请号:CN202110015403.3

    申请日:2021-01-04

    Abstract: 本发明涉及一种基于融合字形信息的服药单识别结果纠错方法,属于文字识别领域,包括构建一个标准药品词库,将词库中的每个药品信息作为一个节点存储在BK树内存结构中,设置搜索距离阈值n,通过阈值搜索规则减少数据搜索规模,得到结果候选集;将文字识别后待纠错字符串与结果候选集中的字符串进行相似度匹配,在原有的相似度匹配方案基础上改进传统的编辑距离公式,保持插入和删除操作代价不变,降低替换字符代价;在进行替换字符操作时,考虑字符的五笔编码、四角码和笔画三个字形相关信息,增大字符串近似匹配精度;将相似度最高的字符串作为纠错结果进行替换。本发明通过对服药单识别结果纠错,提高服药单识别准确率。

Patent Agency Ranking