一种基于主题模型和ILP的看病攻略生成方法

    公开(公告)号:CN108231200B

    公开(公告)日:2020-06-30

    申请号:CN201810026521.2

    申请日:2018-01-11

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于主题模型和ILP的看病攻略生成方法。步骤如下:1)采集疾病知识和用户发布的看病经历数据,从搜狗词库、中医药主题词典、百度百科获取领域知识词典。2)将看病经历数据去重后融合入库。3)利用疾病知识制作疾病的攻略模板,攻略模板包含九大主题版块。4)对看病经历进行实体识别。5)对攻略模板和包含实体的看病经历进行联合主题建模,生成主题‑词分布和主题‑实体分布。6)利用主题‑词分布为每一主题版块选取若干篇看病经历。7)将步骤6)中的看病经历进行分句。8)利用主题‑词分布和主题‑实体分布,进行ILP优化求解,从而得到每种疾病九大主题版块的看病攻略文摘。

    基于层次序列标注的古代医案处方抽取方法

    公开(公告)号:CN111178047A

    公开(公告)日:2020-05-19

    申请号:CN201911347473.8

    申请日:2019-12-24

    Applicant: 浙江大学

    Inventor: 张引 熊海辉

    Abstract: 本发明公开了一种基于层次序列标注的古代医案处方抽取方法,采用BERT+CRF的层次序列标注网络,包括输入层、特征抽取层、全连接层、药与方剂名预测CRF层、处方预测CRF层。首先,本发明不需要对医案进行分句,直接以完整的医案作为输入,避免了分句造成的错误传播。其次,以序列标注的形式获得处方文本,直接获取最相关的文本片段。最后,在识别过程中考虑了药名和方剂名的信息,增强了处方抽取过程中的特征表示,获得了更好的效果,能够利用少量人工标注的数据来识别古代医案中的处方文本;本发明还设计了一种适用于模型挑选的基于BLEU的评价指标方法,用以量化模型抽取结果与标注结果之间的匹配层度,获取最佳模型。

    一种基于主题模型和ILP的看病攻略生成方法

    公开(公告)号:CN108231200A

    公开(公告)日:2018-06-29

    申请号:CN201810026521.2

    申请日:2018-01-11

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于主题模型和ILP的看病攻略生成方法。步骤如下:1)采集疾病知识和用户发布的看病经历数据,从搜狗词库、中医药主题词典、百度百科获取领域知识词典。2)将看病经历数据去重后融合入库。3)利用疾病知识制作疾病的攻略模板,攻略模板包含九大主题版块。4)对看病经历进行实体识别。5)对攻略模板和包含实体的看病经历进行联合主题建模,生成主题‑词分布和主题‑实体分布。6)利用主题‑词分布为每一主题版块选取若干篇看病经历。7)将步骤6)中的看病经历进行分句。8)利用主题‑词分布和主题‑实体分布,进行ILP优化求解,从而得到每种疾病九大主题版块的看病攻略文摘。

    基于层次序列标注的古代医案处方抽取方法

    公开(公告)号:CN111178047B

    公开(公告)日:2021-08-27

    申请号:CN201911347473.8

    申请日:2019-12-24

    Applicant: 浙江大学

    Inventor: 张引 熊海辉

    Abstract: 本发明公开了一种基于层次序列标注的古代医案处方抽取方法,采用BERT+CRF的层次序列标注网络,包括输入层、特征抽取层、全连接层、药与方剂名预测CRF层、处方预测CRF层。首先,本发明不需要对医案进行分句,直接以完整的医案作为输入,避免了分句造成的错误传播。其次,以序列标注的形式获得处方文本,直接获取最相关的文本片段。最后,在识别过程中考虑了药名和方剂名的信息,增强了处方抽取过程中的特征表示,获得了更好的效果,能够利用少量人工标注的数据来识别古代医案中的处方文本;本发明还设计了一种适用于模型挑选的基于BLEU的评价指标方法,用以量化模型抽取结果与标注结果之间的匹配层度,获取最佳模型。

Patent Agency Ranking