-
公开(公告)号:CN113408276A
公开(公告)日:2021-09-17
申请号:CN202110678708.2
申请日:2021-06-18
Applicant: 华东理工大学
IPC: G06F40/289 , G06F40/242 , G06F40/205
Abstract: 本发明提出了一种基于语言模型的跨专科文本结构化方法。对于电子病历文本结构化任务来说,从抽取目标上来说分为分类型、文本跨度型和生成型三类。本发明使用了一种端到端的文本结构化方法,将病历文本视为知识,将字段名做一定变换后构造成问题,让模型回答出对应的字段值,将三类文本结构化任务转换为生成式的问答任务,使得算法具有跨专科任务的可迁移性与解决不同类型任务的灵活性。
-
公开(公告)号:CN113408277A
公开(公告)日:2021-09-17
申请号:CN202110683036.4
申请日:2021-06-18
Applicant: 华东理工大学
IPC: G06F40/289 , G06F40/253 , G16H15/00
Abstract: 本发明提出了一种基于电子病历文本的可迁移语言模型,该模型通过医学知识库将电子病历文本分离成模板与术语两大部分,先利用Pattern Attention对自然语言模板单独建模,再利用KG Cross Attention融合对应的医疗术语,使得模型能够利用医学知识库分离病历文本进行建模,从而完成跨专科的信息抽取。为了让模型更加适应于电子病历文本,本发明设计了三种预训练任务,通过这种方法对模型进行预训练后,可以大幅降低模型在相近专科内的迁移难度。
-