-
公开(公告)号:CN106844351B
公开(公告)日:2020-02-21
申请号:CN201710101839.8
申请日:2017-02-24
Applicant: 易保互联医疗信息科技(北京)有限公司 , 哈尔滨工业大学
IPC: G06F40/295 , G16H40/20
Abstract: 本发明提供了一种面向多数据源的医疗机构组织类实体识别方法及装置,涉及医疗实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的医疗机构组织类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组医疗机构组织类候选实体和第二组医疗机构组织类候选实体;根据预先设置的判断策略确定医疗机构组织类实体结果。
-
公开(公告)号:CN106933802B
公开(公告)日:2020-02-21
申请号:CN201710101834.5
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
IPC: G06F40/295 , G06Q40/08 , G06Q50/22
Abstract: 本发明提供了一种面向多数据源的社保类实体识别方法及装置,涉及实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的社保类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组社保类候选实体和第二组社保类候选实体;根据预先设置的判断策略选择第一组社保类候选实体或第二组社保类候选实体作为所述待处理语句中的社保类实体。
-
公开(公告)号:CN106933802A
公开(公告)日:2017-07-07
申请号:CN201710101834.5
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
Abstract: 本发明提供了一种面向多数据源的社保类实体识别方法及装置,涉及实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的社保类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组社保类候选实体和第二组社保类候选实体;根据预先设置的判断策略选择第一组社保类候选实体或第二组社保类候选实体作为所述待处理语句中的社保类实体。
-
公开(公告)号:CN106844351A
公开(公告)日:2017-06-13
申请号:CN201710101839.8
申请日:2017-02-24
Applicant: 黑龙江特士信息技术有限公司 , 哈尔滨工业大学
Abstract: 本发明提供了一种面向多数据源的医疗机构组织类实体识别方法及装置,涉及医疗实体识别技术领域。方法包括:获取原始数据中的待处理语句;将待处理语句进行单字切分,确定每个文字;根据预先训练完成的CRF训练模型,确定待处理语句中的每个文字在待处理语句中的实体标记,并确定待处理语句的实体标记序列;根据待处理语句的实体标记序列,确定待处理语句的第一组候选实体;根据预先设置的医疗机构组织类术语切分策略,对待处理语句进行术语切分,确定第二组候选实体;对各候选实体进行筛选,分别形成第一组医疗机构组织类候选实体和第二组医疗机构组织类候选实体;根据预先设置的判断策略确定医疗机构组织类实体结果。
-
-
-