-
公开(公告)号:CN117116407A
公开(公告)日:2023-11-24
申请号:CN202311367938.2
申请日:2023-10-23
Applicant: 之江实验室
IPC: G16H10/60 , G16H50/70 , G06F40/205
Abstract: 本发明涉及一种基于电子病历的患者画像生成方法、装置及存储介质,其中方法包括:基于原始电子病历数据得到各业务场景下的长文本形式的电子病历数据;根据文本内容确定电子病历文本的深层结构化结果;构建训练集,对信息抽取模型进行训练;基于训练好的信息抽取模型,输入病历文本数据,得到对应于该文本的深层结构化结果;取目标患者在各业务场景下的各类型文本对应的深层结构化结果,并根据时间顺序进行整合得到患者画像。与现有技术相比,本发明具有体现患者病情细节与动态变化的同时减小无用信息量等优点。
-
公开(公告)号:CN116994694A
公开(公告)日:2023-11-03
申请号:CN202311263207.3
申请日:2023-09-27
Applicant: 之江实验室
IPC: G16H10/60 , G16H50/70 , G06F40/295 , G06F16/33
Abstract: 本发明涉及基于信息提取的患者病历数据筛选方法、装置和介质,方法包括以下步骤:S1、建立训练数据集;S2、采用S1的训练数据集对大语言模型进行微调,实现对分析模型的训练;S3、将预处理后的实际的病历数据输入训练好的分析模型,模型依次对数据进行信息提取和信息推理,然后重复信息提取和信息推理,直至满足迭代终止条件,此时得到提取结果;S4、获取自然文本描述的筛选条件,训练好的分析模型对筛选条件进行解析,提取关键信息,改写为对应的正则表达式,在S3的提取结果中筛选符合正则表达式的病历信息,以筛选符合条件的患者。与现有技术相比,本发明具有上下文理解能力强、系统友好度好等优点。
-
公开(公告)号:CN114861600B
公开(公告)日:2022-12-13
申请号:CN202210793967.4
申请日:2022-07-07
Applicant: 之江实验室
IPC: G06F40/117 , G06F40/166 , G06F40/274 , G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向NER的中文临床文本数据增强方法及装置,通过数据预处理得到未标注数据和标签线性化处理的标注数据。使用未标注数据,通过掩盖文本中的部分信息,基于保留信息对掩盖部分进行预测,同时引入实体词级判别任务,进行基于片段的语言模型预训练;在微调阶段引入多种解码机制,基于预训练后的基于片段的语言模型得到文本向量和文本数据之间的关系,将线性化的带实体标签数据转化为文本向量,在文本生成模型的预测阶段通过正向解码和反向解码进行文本生成,通过对标签进行解析,得到带有标注信息的增强数据。本发明在进一步提升数据多样性的同时,对增强数据的质量也做了改善,从而确保模型可以生成更多高质量增强数据。
-
公开(公告)号:CN117012374B
公开(公告)日:2024-01-26
申请号:CN202311280829.7
申请日:2023-10-07
Applicant: 之江实验室
Abstract: 病情发展,并自动及时预测推荐相应治疗方案及本发明涉及一种融合事件图谱和深度强化 预警风险。学习的医疗随访系统及方法,该系统包括:特征事件图谱构建模块用于获取第一用户临床特征数据,以构建临床特征事件图谱;随访推荐模块基于临床特征事件图谱,结合预设的状态预测及动作推荐模型,预测出第一用户当前状态信息以及输出对应诊疗动作策略;风险预警模块根据第一用户当前状态信息,从临床特征事件图谱中搜索出相应风险因素并进行预警提示。与现有技术相比,本发明将强化学习和特征事件图谱相结(56)对比文件Yuanyuan Jia etc..DKDR: An Approachof Knowledge Graph and Deep ReinforcementLearning for Disease Diagnosis《.IEEEInternational Symposium on Parallel andDistributed Processing withApplications》.第1303-1308页.Liang, Y etc..Deep KnowledgeReasoning guided Disease Prediction《.2022 IEEE International Conference onSystems, Man, and Cybernetics (SMC)》.2022,第2695-2702页.卢严砖;孔祥勇;李星星;徐云舟;吴汶憶;陈学武;朱睿琪“.医路同行”智能医疗服务平台设计与实现.软件.2020,(第01期),第242-247页.
-
公开(公告)号:CN117077649A
公开(公告)日:2023-11-17
申请号:CN202311336529.6
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F40/186 , G06F40/166 , G06F16/28
Abstract: 本说明书公开了一种生成医疗文本提取模版方法,从上述方法可以看出,本申请将若干医疗文本输入训练完成的提取模型,得到提取模型输出的若干医疗文本分别对应的候选提取模版。根据候选提取模版中每个元素出现频率,以及与其他元素的共现次数,分别确定每个元素的代表性和可靠性。根据代表性以及可靠性,确定每个元素的置信度,根据置信度对候选提取模版过滤,提高候选提取模板包含的元素对医疗文本覆盖率。将过滤后的候选提取模版进行聚合,可以提高候选提取模板的泛化性,根据聚合结果,确定目标提取模版。实现了自动生成医疗文本提取模版,减少人力成本,提高了提取医学信息的效率和准确性。
-
公开(公告)号:CN114861600A
公开(公告)日:2022-08-05
申请号:CN202210793967.4
申请日:2022-07-07
Applicant: 之江实验室
IPC: G06F40/117 , G06F40/166 , G06F40/274 , G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向NER的中文临床文本数据增强方法及装置,通过数据预处理得到未标注数据和标签线性化处理的标注数据。使用未标注数据,通过掩盖文本中的部分信息,基于保留信息对掩盖部分进行预测,同时引入实体词级判别任务,进行基于片段的语言模型预训练;在微调阶段引入多种解码机制,基于预训练后的基于片段的语言模型得到文本向量和文本数据之间的关系,将线性化的带实体标签数据转化为文本向量,在文本生成模型的预测阶段通过正向解码和反向解码进行文本生成,通过对标签进行解析,得到带有标注信息的增强数据。本发明在进一步提升数据多样性的同时,对增强数据的质量也做了改善,从而确保模型可以生成更多高质量增强数据。
-
-
-
-
-