-
公开(公告)号:CN110728291B
公开(公告)日:2022-02-22
申请号:CN201910629792.1
申请日:2019-07-12
Applicant: 之江实验室
IPC: G06K9/62
Abstract: 本发明公开了一种基于多中心模式下随机森林算法的特征重要性排序系统,该系统包括部署在参与协同计算的各中心的前置机、接收并整合各中心特征重要性排序结果的中心服务器、将最终特征重要性排序结果反馈给用户的结果展示模块。本发明基于多中心的随机森林算法,在各个中心分别计算特征重要性排序结果;在中心服务器进行整合各个中心的排序结果,形成全局性的特征重要性排序结果。本发明在不暴露各个中心数据的条件下,各个中心的数据始终在各中心,只向中心服务器传递中间参数,不传递原始数据,有效保障了数据安全和数据中包含的个人隐私。
-
公开(公告)号:CN118230978B
公开(公告)日:2024-08-13
申请号:CN202410660224.9
申请日:2024-05-27
Applicant: 之江实验室
IPC: G16H50/70 , G16H10/60 , G06N5/022 , G06N3/042 , G06N3/0464 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种疾病风险预测方法、系统、电子设备、介质,包括:获取医学知识图谱;根据医学知识图谱从每一个患者的电子病历数据中提取医学实体及其对应的关系从而构建每一个患者对应的电子病历图数据;基于医学知识图谱中的三元组对电子病历图数据进行增强从而获取简化电子病历图数据和扩展电子病历图数据;基于患者的电子病历数据提取患者数值信息表示;基于电子病历图数据提取患者语义信息表示;基于电子病历图数据、简化电子病历图数据、扩展电子病历图数据提取患者结构信息表示;将三者进行拼接得到患者融合表示;将患者融合表示输入至预先训练好的疾病风险预测模型中,得到疾病风险预测结果。
-
公开(公告)号:CN117010494B
公开(公告)日:2024-01-05
申请号:CN202311257598.8
申请日:2023-09-27
Applicant: 之江实验室
IPC: G06N5/02 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于因果表示学习的医学数据生成方法及系统,包括:获取医学知识图谱;根据医学知识图谱将患者医学数据重构为患者数据图谱;根据患者数据图谱得到邻接矩阵和节点初始嵌入表示集合,通过图编码器得到患者表征;根据患者表征利用注意力机制将患者数据图谱解耦为患者因果特征图和患者混淆特征图;根据患者因果特征图和患者混淆特征图生成患者重构因果特征图、患者合成因果特征图,构建并基于对抗学习训练医学数据生成模型,实现无法区分患者因果特征图与患者合成因果特征图,同时使患者因果特征图与患者重构因果特征图尽可能相似;将目标患者数据图谱输入至训练好的医学数据生成模型,得到生成的医学数据。
-
公开(公告)号:CN116759042B
公开(公告)日:2023-12-22
申请号:CN202311057093.7
申请日:2023-08-22
Applicant: 之江实验室
IPC: G16H10/60 , G16H50/70 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于环形一致性的反事实医疗数据生成系统,包括数据准备模块和反事实医疗数据生成模块,数据准备模块用于获取准备好的患者数据,反事实医疗数据生成模块用于生成反事实患者数据,利用生成器和训练好的解码器生成符合真实取值范围的与患者数据结局相反的反事实患者数据和与重建数据,基于结局相同的患者数据和反事实患者数据优化判别器;基于结局相同的患者数据和重建数据的环形一致性差异优化生成器,优化完成后固定生成器的参数生成反事实患者数据。本发明还公开了一种基于环形一致性的反事实数据生成方法。本发明方法能够生成准确可靠且鲁棒性强的反事实患
-
公开(公告)号:CN117010494A
公开(公告)日:2023-11-07
申请号:CN202311257598.8
申请日:2023-09-27
Applicant: 之江实验室
IPC: G06N5/02 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于因果表示学习的医学数据生成方法及系统,包括:获取医学知识图谱;根据医学知识图谱将患者医学数据重构为患者数据图谱;根据患者数据图谱得到邻接矩阵和节点初始嵌入表示集合,通过图编码器得到患者表征;根据患者表征利用注意力机制将患者数据图谱解耦为患者因果特征图和患者混淆特征图;根据患者因果特征图和患者混淆特征图生成患者重构因果特征图、患者合成因果特征图,构建并基于对抗学习训练医学数据生成模型,实现无法区分患者因果特征图与患者合成因果特征图,同时使患者因果特征图与患者重构因果特征图尽可能相似;将目标患者数据图谱输入至训练好的医学数据生成模型,得到生成的医学数据。
-
公开(公告)号:CN116434969A
公开(公告)日:2023-07-14
申请号:CN202310701410.8
申请日:2023-06-14
Applicant: 之江实验室
Abstract: 本发明公开了一种基于因果结构不变性的多中心慢性病预测装置,包括以下步骤,根据单个中心患者特征数据与其结局,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系,当拟合误差和不同中心因果关系之间的差异达到预设要求时,该因果关系经噪声处理后得到多中心场景下稳定的因果结构;通过因果结构建立更为直观的因果结构图;通过因果结构图构建慢性病结局预测模型。本发明挖掘数据中更深层次的因果逻辑关系,解决了传统方法可解释性不足的问题,为慢性病决策支持提供更加合理的决策建议。
-
公开(公告)号:CN115719647A
公开(公告)日:2023-02-28
申请号:CN202310029096.3
申请日:2023-01-09
Applicant: 之江实验室
Abstract: 本发明公开了融合主动学习和对比学习的血透并发心血管疾病预测系统,包括:血透数据准备模块,用于利用医院电子信息系统和日常监测设备提取患者样本的结构化数据,并对所述结构化数据处理得到扩增结构化数据;血透并发心血管疾病风险预测模块,用于构建风险评价模型,将所述扩增结构化数据通过所述风险评价模型训练学习得到患者表征和评分,并利用所述患者表征和评分进行血透并发心血管疾病风险预测。本发明解决正负样本匹配问题,利用血透并发心血管疾病的真实标签数据,迭代式地更新对比学习模型参数,利用真实的并发症结果标签提升模型性能;解决采集的样本过少或者阳性样本和阴性样本数量不平衡的问题,同时减少扩增数据与原始数据的差异性。
-
公开(公告)号:CN112530594A
公开(公告)日:2021-03-19
申请号:CN202110179779.8
申请日:2021-02-08
Applicant: 之江实验室
Abstract: 本发明公开了一种基于卷积生存网络的血透并发症长期风险预测系统,该系统包括数据采集模块、数据预处理模块、学习预测模块和结果展示模块;本发明利用卷积神经网络处理多维度的血透时序特征;卷积神经网络结合Cox比例风险假设,提出卷积生存网络;在利用卷积生存网络的基础上,采用Breslow估计基准风险函数,计算患者的长期风险变化情况。本发明可以充分利用医学研究中常见的截尾数据;应用卷积神经网络的主体架构,便于可视化分析,做出具有可解释性、具有启发性的结果;可以预测患者长期的风险变化情况。
-
公开(公告)号:CN110728291A
公开(公告)日:2020-01-24
申请号:CN201910629792.1
申请日:2019-07-12
Applicant: 之江实验室
IPC: G06K9/62
Abstract: 本发明公开了一种基于多中心模式下随机森林算法的特征重要性排序系统,该系统包括部署在参与协同计算的各中心的前置机、接收并整合各中心特征重要性排序结果的中心服务器、将最终特征重要性排序结果反馈给用户的结果展示模块。本发明基于多中心的随机森林算法,在各个中心分别计算特征重要性排序结果;在中心服务器进行整合各个中心的排序结果,形成全局性的特征重要性排序结果。本发明在不暴露各个中心数据的条件下,各个中心的数据始终在各中心,只向中心服务器传递中间参数,不传递原始数据,有效保障了数据安全和数据中包含的个人隐私。
-
公开(公告)号:CN120030162A
公开(公告)日:2025-05-23
申请号:CN202510519701.4
申请日:2025-04-24
Applicant: 之江实验室
IPC: G06F16/35 , G06V30/412 , G06V30/413
Abstract: 本申请涉及一种表格数据抽取方法、装置、计算机设备和存储介质,其中,该表格数据抽取方法包括:根据预设的第一大语言模型和第二大语言模型,确定各样本文档中的多个典型表格;其中,第一大语言模型用于对每个样本文档中的样本表格进行表格抽取,第二大语言模型用于基于表格抽取结果确定各样本文档中的多个典型表格;确定各典型表格中与目标文档中待抽取表格相匹配的目标典型表格;在目标典型表格关联有格式修正信息时,基于格式修正信息对待抽取表格进行修正;基于修正后待抽取表格的格式,对待抽取表格进行表格抽取,得到待抽取表格中的表格数据。通过本申请,解决了针对复杂表格数据的精细抽取效果不佳的问题,实现了复杂表格数据的精细抽取。
-
-
-
-
-
-
-
-
-