-
公开(公告)号:CN119230043A
公开(公告)日:2024-12-31
申请号:CN202411319544.4
申请日:2024-09-20
Applicant: 厦门大学附属翔安医院
IPC: G16H10/60 , G06N3/0455 , G06N3/08 , G06F18/241 , G06F18/214 , G06F40/295 , G06F18/10 , G06F16/901
Abstract: 本发明公开了一种基于超图的电子病历文本分析方法,具体包括如下步骤:步骤一、数据采集:确定数据采集的来源,通过与数据源的接口或AP I进行通信,自动收集医疗对话记录,并将采集到的数据安全地存储在数据库或数据仓库中;步骤二、数据预处理:对数据进行数据清洗、格式化标准、去重、数据分割、特征提取、数据转换、数据增强和敏感信息脱敏;本发明涉及电子病历文本技术领域,本发明提供一种电子病历文本处理技术,旨在改善实体识别和关系抽取任务中负样本对模型性能的影响。通过利用基于跨度的联合实体关系抽取中的多任务学习方法,解决当前模型在处理非实体跨度或不相关跨度对时性能下降的问题。