-
公开(公告)号:CN113177416B
公开(公告)日:2022-06-07
申请号:CN202110532819.2
申请日:2021-05-17
Applicant: 同济大学
IPC: G06F40/30 , G06F40/211 , G06F40/186 , G06N3/04
Abstract: 目前的中文医疗事理知识图谱事件元素检测研究主要基于单一的模式匹配或深度学习模型,且未对事件元素进行长短级粒度划分,不能有效抽取长句级元素,导致了模型灵活性不高、泛化性差。因此,本发明提出了一种联合序列标注和模式匹配的事件元素检测方法,创新点在依据事件类型对其中的事件元素进行粒度区分,并针对不同粒度的事件元素采用不同的方法进行检测。首先,对于短词级事件元素检测,使用基于序列标注的BERT‑BiLSTM‑CRF模型,并结合实体信息、触发词信息等语料特征,以实现较强的可扩展性。其次,通过联合依存句法分析的模式匹配方法,进行了长句级事件元素的检测,由此提高事件元素检测的准确率。
-
公开(公告)号:CN112560900A
公开(公告)日:2021-03-26
申请号:CN202011365674.3
申请日:2020-11-28
Applicant: 同济大学
Abstract: 本发明目的在于克服现有技术的不足,给出一种面向样本不均衡的多疾病分类器设计方法,首先对按其疾病类别将医学病例数据划分为多个病例样本子集,然后对每个样本子集进行病症关联规则的特征选择方法,选择出该病例样本子集的特征向量,然后在不均衡度为上限阈值的前提条件下,迭代随机更新采用概率,对病例样本子集进行均衡化,然后再训练每一个样本子集的弱分类器并计算其分类效果,并最终通过判断macro‑F1的差值是否满足迭代收敛阈值来决定迭代生成多疾病分类器是否结束。
-
公开(公告)号:CN113177416A
公开(公告)日:2021-07-27
申请号:CN202110532819.2
申请日:2021-05-17
Applicant: 同济大学
IPC: G06F40/30 , G06F40/211 , G06F40/186 , G06N3/04
Abstract: 目前的中文医疗事理知识图谱事件元素检测研究主要基于单一的模式匹配或深度学习模型,且未对事件元素进行长短级粒度划分,不能有效抽取长句级元素,导致了模型灵活性不高、泛化性差。因此,本发明提出了一种联合序列标注和模式匹配的事件元素检测方法,创新点在依据事件类型对其中的事件元素进行粒度区分,并针对不同粒度的事件元素采用不同的方法进行检测。首先,对于短词级事件元素检测,使用基于序列标注的BERT‑BiLSTM‑CRF模型,并结合实体信息、触发词信息等语料特征,以实现较强的可扩展性。其次,通过联合依存句法分析的模式匹配方法,进行了长句级事件元素的检测,由此提高事件元素检测的准确率。
-
公开(公告)号:CN112560900B
公开(公告)日:2023-01-20
申请号:CN202011365674.3
申请日:2020-11-28
Applicant: 同济大学
IPC: G06F18/2431 , G06F18/214 , G06N5/025 , G06N20/20 , G16H50/20 , G16H50/70
Abstract: 本发明目的在于克服现有技术的不足,给出一种面向样本不均衡的多疾病分类器设计方法,首先对按其疾病类别将医学病例数据划分为多个病例样本子集,然后对每个样本子集进行病症关联规则的特征选择方法,选择出该病例样本子集的特征向量,然后在不均衡度为上限阈值的前提条件下,迭代随机更新采用概率,对病例样本子集进行均衡化,然后再训练每一个样本子集的弱分类器并计算其分类效果,并最终通过判断macro‑F1的差值是否满足迭代收敛阈值来决定迭代生成多疾病分类器是否结束。
-
公开(公告)号:CN112241457A
公开(公告)日:2021-01-19
申请号:CN202011002672.8
申请日:2020-09-22
Applicant: 同济大学
IPC: G06F16/36 , G06F16/35 , G06F40/211 , G06F40/242 , G06F40/295 , G06K9/62 , G16H10/60
Abstract: 目前的中文医疗事理知识图谱事件检测研究主要基于模式匹配的方法和基于聚类的方法,均未考虑到医疗事件内的实体分布特点,也忽略了每篇文档中医疗事件之间的篇章一致性分布规律。本发明一种融合扩展特征的事理知识图谱事件检测方法,创新点在于利用了医疗事件句内的实体信息和医疗事件句之间的事件信息辅助事件检测。首先按照ACE标准设计医疗事件表示模板并构建事件触发词词典,其次采用半自动语料标注方法对医疗文本进行实体标注,然后在基本特征的基础上,根据事件内的实体分布特点,选择不同的实体信息特征作为扩展特征,使用SVM对医疗事件句内的触发词进行初步的提取和分类,最后利用医疗文档的篇章一致性分布规律,提高事件检测的最终结果。
-
-
-
-