-
公开(公告)号:CN106372439A
公开(公告)日:2017-02-01
申请号:CN201610836533.2
申请日:2016-09-21
Applicant: 北京大学
CPC classification number: G06F17/2715 , G06F17/277 , G06F17/2795 , G06F2216/03 , G16H50/70
Abstract: 本发明公布了一种基于病例库的疾病症状及其权重知识的获取和处理方法,以互联网上的海量病例库作为信息源,通过对信息源原始数据进行处理,自动获取疾病症状及其权重知识;包括:采取正则表达式进行HTML标签匹配,通过网络爬虫策略获取疾病症状原始数据;进行词语相似度计算和同义词识别获取医学词语相似度表和医学词语同义词表;进行分类、TF-IDF词频统计、无量纲化处理,获取疾病症状及其权重等多个参数,用于整体评价疾病与症状关系。采用本发明提供的技术方案,能够节省大量人力、财力和时间;得出的疾病症状及其权重结果更加合理;适用于导医系统和基于互联网的疾病自我预诊系统等场景。
-
公开(公告)号:CN113724884A
公开(公告)日:2021-11-30
申请号:CN202111031558.2
申请日:2016-09-21
Applicant: 北京大学
IPC: G16H50/70 , G06F40/284 , G06F40/247 , G06F40/216
Abstract: 本发明涉及一种基于病例库的疾病症状及其权重知识的获取和处理方法,以互联网上的海量病例库作为信息源,通过对信息源原始数据进行处理,自动获取疾病症状及其权重知识;包括:采取正则表达式进行HTML标签匹配,通过网络爬虫策略获取疾病症状原始数据;进行词语相似度计算和同义词识别获取医学词语相似度表和医学词语同义词表;进行分类、TF‑IDF词频统计、无量纲化处理,获取疾病症状及其权重等多个参数,用于整体评价疾病与症状关系。采用本发明提供的技术方案,能够节省大量人力、财力和时间;得出的疾病症状及其权重结果更加合理;适用于导医系统和基于互联网的疾病自我预诊系统等场景。
-