一种基于语言模型的跨专科文本结构化方法

    公开(公告)号:CN113408276A

    公开(公告)日:2021-09-17

    申请号:CN202110678708.2

    申请日:2021-06-18

    Abstract: 本发明提出了一种基于语言模型的跨专科文本结构化方法。对于电子病历文本结构化任务来说,从抽取目标上来说分为分类型、文本跨度型和生成型三类。本发明使用了一种端到端的文本结构化方法,将病历文本视为知识,将字段名做一定变换后构造成问题,让模型回答出对应的字段值,将三类文本结构化任务转换为生成式的问答任务,使得算法具有跨专科任务的可迁移性与解决不同类型任务的灵活性。

    一种基于电子病历文本的可迁移语言模型

    公开(公告)号:CN113408277A

    公开(公告)日:2021-09-17

    申请号:CN202110683036.4

    申请日:2021-06-18

    Abstract: 本发明提出了一种基于电子病历文本的可迁移语言模型,该模型通过医学知识库将电子病历文本分离成模板与术语两大部分,先利用Pattern Attention对自然语言模板单独建模,再利用KG Cross Attention融合对应的医疗术语,使得模型能够利用医学知识库分离病历文本进行建模,从而完成跨专科的信息抽取。为了让模型更加适应于电子病历文本,本发明设计了三种预训练任务,通过这种方法对模型进行预训练后,可以大幅降低模型在相近专科内的迁移难度。

Patent Agency Ranking