-
公开(公告)号:CN108231200B
公开(公告)日:2020-06-30
申请号:CN201810026521.2
申请日:2018-01-11
Applicant: 浙江大学
IPC: G16H50/70 , G06F40/211 , G06F40/295
Abstract: 本发明公开了一种基于主题模型和ILP的看病攻略生成方法。步骤如下:1)采集疾病知识和用户发布的看病经历数据,从搜狗词库、中医药主题词典、百度百科获取领域知识词典。2)将看病经历数据去重后融合入库。3)利用疾病知识制作疾病的攻略模板,攻略模板包含九大主题版块。4)对看病经历进行实体识别。5)对攻略模板和包含实体的看病经历进行联合主题建模,生成主题‑词分布和主题‑实体分布。6)利用主题‑词分布为每一主题版块选取若干篇看病经历。7)将步骤6)中的看病经历进行分句。8)利用主题‑词分布和主题‑实体分布,进行ILP优化求解,从而得到每种疾病九大主题版块的看病攻略文摘。
-
公开(公告)号:CN111178047A
公开(公告)日:2020-05-19
申请号:CN201911347473.8
申请日:2019-12-24
Applicant: 浙江大学
IPC: G06F40/211 , G06F40/279 , G16H20/10 , G16H50/70
Abstract: 本发明公开了一种基于层次序列标注的古代医案处方抽取方法,采用BERT+CRF的层次序列标注网络,包括输入层、特征抽取层、全连接层、药与方剂名预测CRF层、处方预测CRF层。首先,本发明不需要对医案进行分句,直接以完整的医案作为输入,避免了分句造成的错误传播。其次,以序列标注的形式获得处方文本,直接获取最相关的文本片段。最后,在识别过程中考虑了药名和方剂名的信息,增强了处方抽取过程中的特征表示,获得了更好的效果,能够利用少量人工标注的数据来识别古代医案中的处方文本;本发明还设计了一种适用于模型挑选的基于BLEU的评价指标方法,用以量化模型抽取结果与标注结果之间的匹配层度,获取最佳模型。
-
公开(公告)号:CN108231200A
公开(公告)日:2018-06-29
申请号:CN201810026521.2
申请日:2018-01-11
Applicant: 浙江大学
Abstract: 本发明公开了一种基于主题模型和ILP的看病攻略生成方法。步骤如下:1)采集疾病知识和用户发布的看病经历数据,从搜狗词库、中医药主题词典、百度百科获取领域知识词典。2)将看病经历数据去重后融合入库。3)利用疾病知识制作疾病的攻略模板,攻略模板包含九大主题版块。4)对看病经历进行实体识别。5)对攻略模板和包含实体的看病经历进行联合主题建模,生成主题‑词分布和主题‑实体分布。6)利用主题‑词分布为每一主题版块选取若干篇看病经历。7)将步骤6)中的看病经历进行分句。8)利用主题‑词分布和主题‑实体分布,进行ILP优化求解,从而得到每种疾病九大主题版块的看病攻略文摘。
-
公开(公告)号:CN111178047B
公开(公告)日:2021-08-27
申请号:CN201911347473.8
申请日:2019-12-24
Applicant: 浙江大学
IPC: G06F40/211 , G06F40/279 , G16H20/10 , G16H50/70
Abstract: 本发明公开了一种基于层次序列标注的古代医案处方抽取方法,采用BERT+CRF的层次序列标注网络,包括输入层、特征抽取层、全连接层、药与方剂名预测CRF层、处方预测CRF层。首先,本发明不需要对医案进行分句,直接以完整的医案作为输入,避免了分句造成的错误传播。其次,以序列标注的形式获得处方文本,直接获取最相关的文本片段。最后,在识别过程中考虑了药名和方剂名的信息,增强了处方抽取过程中的特征表示,获得了更好的效果,能够利用少量人工标注的数据来识别古代医案中的处方文本;本发明还设计了一种适用于模型挑选的基于BLEU的评价指标方法,用以量化模型抽取结果与标注结果之间的匹配层度,获取最佳模型。
-
-
-