一种基于数据流匹配的电子病历查重率估计方法

    公开(公告)号:CN115983233A

    公开(公告)日:2023-04-18

    申请号:CN202310018531.2

    申请日:2023-01-04

    Abstract: 本发明属于数据处理技术领域,具体涉及一种基于数据流匹配的电子病历查重率估计方法,包括:获取历史病历数据,根据历史病历数据构建关键词词典和词频统计表;获取用户的病历数据信息,并采用对病历数据信息中的中文文字进行编码;根据关键词词典和词频统计表提取待查重病历数据信息中的特征词;采用领域词系统对提取出的特征词进行标准化处理,得到统一的特征词;对编码后的数据流,计算统一特征词和目标特征词的相似度;根据相似度计算结果对病历数据信息进行综合判别,得到电子病历查重率估计结果;本发明通过综合采用CRF与SVM模型,抽取电子病历实体与实体关系,提高了实体的检测准确度。

Patent Agency Ranking