一种面向NER的中文临床文本数据增强方法及装置

    公开(公告)号:CN114861600A

    公开(公告)日:2022-08-05

    申请号:CN202210793967.4

    申请日:2022-07-07

    Abstract: 本发明公开了一种面向NER的中文临床文本数据增强方法及装置,通过数据预处理得到未标注数据和标签线性化处理的标注数据。使用未标注数据,通过掩盖文本中的部分信息,基于保留信息对掩盖部分进行预测,同时引入实体词级判别任务,进行基于片段的语言模型预训练;在微调阶段引入多种解码机制,基于预训练后的基于片段的语言模型得到文本向量和文本数据之间的关系,将线性化的带实体标签数据转化为文本向量,在文本生成模型的预测阶段通过正向解码和反向解码进行文本生成,通过对标签进行解析,得到带有标注信息的增强数据。本发明在进一步提升数据多样性的同时,对增强数据的质量也做了改善,从而确保模型可以生成更多高质量增强数据。

    基于自适应重采样深度编码器网络的通路异常检测系统

    公开(公告)号:CN114783524A

    公开(公告)日:2022-07-22

    申请号:CN202210685472.X

    申请日:2022-06-17

    Abstract: 本发明公开了一种基于自适应重采样深度编码器网络的通路异常检测系统,包括数据采集模块、数据预处理模块、通路异常检测模型构建模块和通路异常检测模块,本发明利用基于神经网络的深度编码器算法,将个体通路异常情况评估问题转换为异常检测问题,区分异常样本与正常样本,并评估异常样本相较于正常样本的通路异常程度,改进基于主成分曲线的通路异常情况评估算法无法稳定评估通路异常情况的问题。在充分利用先验知识的情况下,富集多个生物功能相近的基因的预后信息,有效评估患者的通路异常情况,可用于肿瘤预后预测准确性的提高,辅助医生制定患者的治疗计划。

    一种基于多轮智能问答的相似病历匹配系统及方法

    公开(公告)号:CN113934824B

    公开(公告)日:2022-05-06

    申请号:CN202111528572.3

    申请日:2021-12-15

    Abstract: 本发明公开了一种基于多轮智能问答的相似病历匹配系统及方法,本发明对关键的临床信息及其性质描述设计了全面的问题流程,然后构建多轮智能问答模型,在病历文本中定位临床信息问题答案;在多轮智能问答模型中设计了综合考虑前面若干轮问题答案与当前一轮问题的方法,并且设计了在病历文本中识别答案位置的计算方法,使得多轮智能问答模型考虑的信息更加全面;在多轮智能问答模型中设计了基于医疗领域知识图谱的知识增强方法,进一步保证模型性能;本发明首先计算不同临床信息之间的关系,然后基于它们的关系计算病历文本整体的向量表示,使得病历文本的向量表示中包含了不同临床信息之间的内在联系,从而保证相似病历结果的完整性和准确性。

    基于深度图匹配的医疗数据元自动化分类方法及系统

    公开(公告)号:CN114003791B

    公开(公告)日:2022-04-08

    申请号:CN202111649231.1

    申请日:2021-12-30

    Abstract: 本发明公开了一种基于深度图匹配的医疗数据元自动化分类方法及系统,本发明定义了基于最小元数据信息的医疗数据元图数据模型,使得深度图匹配模型的效果同样适用于极低元数据信息的局部数据沼泽的情况,达到使用最少的元数据信息完成数据元自动化分类的目的,同时保证在图数据模型标准下采集的图结构数据适用于深度图匹配模型的训练;基于表示学习方法计算医疗数据元的向量表示,通过向量表示的分类,快速、自动化筛选有可能映射到标准数据模型的有效数据元;基于图注意力机制计算列顶点的向量表示,构建深度图匹配模型完成医疗数据元的自动化分类。本发明方法及系统具有良好的可拓展性,可应用于各类数据沼泽向数据湖转化问题的处理。

    基于异构图神经网络的医疗术语规范化系统及方法

    公开(公告)号:CN113656604B

    公开(公告)日:2022-02-22

    申请号:CN202111213727.4

    申请日:2021-10-19

    Abstract: 本发明公开了一种基于异构图神经网络的医疗术语规范化系统及方法,首先对各种类型的医疗术语构建关键的信息单元,实现医疗术语的结构化表示,并基于信息单元构建包含各种类型医疗术语的知识图谱。基于此知识图谱构建包含各种类型医疗术语的异构图神经网络,在异构图神经网络的训练过程中综合考虑图的临近节点分布和节点内容编码,用于进行医疗术语规范化。本发明能够充分利用同类医疗术语的信息单元互相之间关联与差异的知识,同时容纳各种类型的医疗术语,能够全面学习医疗领域的知识,并且能够方便地将新类型的医疗术语增加到系统中,减少了新类型医疗术语规范化的工作量。

    一种融合结构化影像数据的医疗数据分析系统

    公开(公告)号:CN110349652B

    公开(公告)日:2022-02-22

    申请号:CN201910629798.9

    申请日:2019-07-12

    Abstract: 本发明公开了一种融合结构化影像数据的医疗数据分析系统,该系统包括影像信息结构化模块、融合与预处理模块、机器学习算法模块,本发明基于Spark和Hadoop实现的分布式数据分析平台,针对医学影像数据难以和医疗电子病历中结构化数据融合分析的难点,利用影像信息结构化模块通过计算机视觉技术对医学影像数据分析并进行关键信息的结构化转化,融合电子病历系统中同一病人的其他诊断信息、人口统计学信息等结构化数据,通过数据预处理模块进行缺失值处理和分类型数据转化,结合机器学习算法模块进行数据分析和结果可视化,形成高效率的医疗数据分析系统,提高多种类多维度医疗数据的利用率,可满足研究人员不同的课题研究需求。

    一种基于半训练和句子选择的远程监督命名实体识别方法

    公开(公告)号:CN114004233A

    公开(公告)日:2022-02-01

    申请号:CN202111644281.0

    申请日:2021-12-30

    Abstract: 本发明公开了一种基于半训练和句子选择的远程监督命名实体识别方法,该方法首先通过半训练策略将双向循环神经网络和条件随机场混合双向循环神经网络和条件随机场混合模型在人工标注数据集上的平衡F分数训练到预设半训练区间;然后采用FNN作为强化学习中的策略网络,来对远程监督数据集中的句子进行选择;接着采用软概率选择出置信度大于阈值的句子;然后将筛选出的句子和人工标注数据集进行合并作为新的训练集;最后利用新的训练集对双向循环神经网络和条件随机场混合双向循环神经网络和条件随机场混合模型进行训练,同时对策略网络进行更新。本发明方法能够有效提高基于远程监督的命名实体识别模型的性能。

    一种医疗数据计算任务智能调度方法及系统

    公开(公告)号:CN113687938A

    公开(公告)日:2021-11-23

    申请号:CN202111251644.4

    申请日:2021-10-27

    Abstract: 本发明公开了一种医疗数据计算任务智能调度方法及系统,首先构建任务队列,任务队列分为首尾相接的排序任务队列和排队等候队列,排序任务队列将规定时间内未完成的任务淘汰,进入排队等候队列,排队等候队列首部元素进入排序任务队列,根据队列内的任务数据计算得到预测模型,通过预测模型对新任务预测执行耗时,根据预测耗时与实际耗时差值对队列内任务优先级进行调整,并根据模型的决定系数判断是否更新模型。本发明在动态调节调度任务执行的情况下,能及时调整长时间占据计算资源的任务,以防止服务器等硬件资源因某个单一资源而一直处于高负载状态,对任务调节挂起后充分利用资源,减少任务等待执行时间,使得整体任务执行的效率提升。

    一种基于自然语言生成技术的知识图谱辅助理解系统

    公开(公告)号:CN110347798B

    公开(公告)日:2021-06-01

    申请号:CN201910629843.0

    申请日:2019-07-12

    Abstract: 本发明公开了一种基于自然语言生成技术的知识图谱辅助理解系统,该系统包括知识图谱选择模块、知识图谱翻译模块和结果展示模块;本发明利用自然语言生成技术将知识图谱转换为自然语言文本,方便领域专家在不了解知识图谱的源代码和软件的基础上,在使用知识图谱前,对于其领域的知识图谱有准确、深入且全面的了解。同时每一个短句与知识图谱本身对应的源代码相关联,如果发现知识图谱存在的冗余和错误信息,可以及时对其进行纠正,且该方法通用性较强。本发明利用可视化方法进一步加快领域专家对于知识图谱的理解。

    一种基于卷积生存网络的血透并发症长期风险预测系统

    公开(公告)号:CN112530594B

    公开(公告)日:2021-05-11

    申请号:CN202110179779.8

    申请日:2021-02-08

    Abstract: 本发明公开了一种基于卷积生存网络的血透并发症长期风险预测系统,该系统包括数据采集模块、数据预处理模块、学习预测模块和结果展示模块;本发明利用卷积神经网络处理多维度的血透时序特征;卷积神经网络结合Cox比例风险假设,提出卷积生存网络;在利用卷积生存网络的基础上,采用Breslow估计基准风险函数,计算患者的长期风险变化情况。本发明可以充分利用医学研究中常见的截尾数据;应用卷积神经网络的主体架构,便于可视化分析,做出具有可解释性、具有启发性的结果;可以预测患者长期的风险变化情况。

Patent Agency Ranking