基于知识图谱及聚类算法的医学相似实体分类方法及系统

    公开(公告)号:CN115080764B

    公开(公告)日:2022-11-01

    申请号:CN202210856458.1

    申请日:2022-07-21

    Abstract: 本发明涉及知识图谱技术领域,具体涉及基于知识图谱及聚类算法的医学相似实体分类方法及系统,本方法包括将医学数据库的数据构成三元组数据集,将三元组数据集作为训练集,对知识图谱学习模型进行训练,得到医学数据库的向量化表示的医学知识图谱,将其三元组通过均值池化层获得三元组的代表向量,利用无监督聚类算法Kmeans对实体和关系的代表向量进行聚类,得出医学知识图谱内的相似术语实体库,将同一簇内的实体作为正样本,将不同簇内的实体作为负样本,将正样本和负样本输入,训练实体相似分类模型,基于实体相似分类模型对实体进行相似判断;本发明解决人工标注相似实体分类繁琐的问题,实现对医学知识图谱无人工的准确构建。

    一种基于知识图谱的模型训练方法、装置、设备及介质

    公开(公告)号:CN115206536A

    公开(公告)日:2022-10-18

    申请号:CN202210551457.6

    申请日:2022-05-18

    Abstract: 本申请提供了一种基于知识图谱的模型训练方法、装置、设备及介质,方法包括:获取多个患者的病历;对于每一患者,基于该患者的病历中的文字信息,得到该患者对应的至少一个三元组;基于每一患者对应的每一三元组,生成知识图谱,并从知识图谱中抽取出异构图;对于每一患者,将异构图中第一节点以及不同第一节点之间的关系作为第一目标模型、第二目标模型和图神经网络模型的输入,将用于表征该患者对于目标疾病的治疗效果的目标标签作为第一目标模型、第二目标模型和图神经网络模型的输出,对第一目标模型、第二目标模型和图神经网络模型进行训练。本申请能够通过训练后的第一目标模型、第二目标模型和图神经网络模型对患者所患疾病的治疗效果进行评估。

    知识图谱构建过程中命名实体识别模型的训练方法和系统

    公开(公告)号:CN115048934A

    公开(公告)日:2022-09-13

    申请号:CN202210663574.1

    申请日:2022-06-13

    Abstract: 本申请公开了一种知识图谱构建过程中命名实体识别模型的训练方法和系统,包括:步骤S1、构建种子训练集;步骤S2、利用种子训练集对命名实体识别模型进行训练,更新命名实体识别模型;步骤S3、基于更新的命名实体识别模型对输入样本进行识别,生成样本识别结果;步骤S4、基于样本识别结果中的模糊命名实体更新种子训练集;步骤S5、重复步骤S2‑步骤S4,直至样本识别结果中无模糊命名实体,训练结束。本申请公开的知识图谱构建过程中命名实体识别模型的训练方法和系统,通过半监督学习的方法,提高了知识图谱构建过程中对命名实体的识别准确度,减少了人工工作量,降低了人工成本。

    一种医学标准映射模型的建立方法、系统及使用方法

    公开(公告)号:CN114996466A

    公开(公告)日:2022-09-02

    申请号:CN202210918247.6

    申请日:2022-08-01

    Abstract: 本发明涉及智慧医疗技术领域,且公开了一种医学标准映射模型的建立方法、系统及使用方法,本发明能够将医学实体数据按照原始词、标准词、标准词编码的类型进行准确的分类,并对分类后的训练数据进行预处理,从而得到统一化的实体数据集;利用统一化的实体数据集作为Bert模型的输入能够减少训练误差,且实体数据集是按照锚文本、正文本和负文本组成的三元组样本的形式进行划分,并能够提高特征向量获取的准确性,加强各文本的特征向量的联系性;同时,通过损失函数的计算和预设条件的设置,能够及时的停止Bert模型的训练,从而获取较准确的医学标准映射模型。

    基于知识蒸馏的病灶区域深度组学特征提取方法及装置

    公开(公告)号:CN114723746A

    公开(公告)日:2022-07-08

    申请号:CN202210566176.8

    申请日:2022-05-24

    Abstract: 本公开提供了一种基于知识蒸馏的病灶区域深度组学特征提取方法及装置,涉及医学图像处理技术领域,该方法包括:获取样本数据集;利用样本训练分类网络,得到病灶区域特征识别模型;将倒数第二层作为特征层,特征层的输出为基础深度特征;将不同的基础深度特征按照关注度进行权重配比得到深度组学特征;构建学生网络;采用所有教师网络训练学生网络;设置损失函数;当损失值达到预设范围时,教师网络对学生网络的训练完成,得到病灶区域深度组学特征提取模型。本公开可针对不同种类的医学影像、不同的疾病类型选取不同的属性进行深度组学特征提取,通过对属性的关注度不同进行权重配置,实现了深度组学特征的自由配置和蒸馏精度的提高。

    标注文件的生成方法、解析方法、电子设备及存储介质

    公开(公告)号:CN120089307A

    公开(公告)日:2025-06-03

    申请号:CN202510219154.8

    申请日:2025-02-26

    Abstract: 本申请提供一种标注文件的生成方法、解析方法、电子设备及存储介质,其中,标注文件的生成方法,包括获取医疗影像的标签轮廓信息;基于标签轮廓信息,确定医疗影像中每一像素点与所有像素标签之间的对应关系;针对医疗影像中的每一像素点,基于该像素点与所有像素标签之间的对应关系,生成二进制整数值;针对医疗影像中的每一像素点,将该像素点对应的二进制整数值,转换为十进制整数值;基于每个像素点对应的十进制整数值,生成预设格式的标注文件。保证了标注文件的规范和通用性的同时,满足了多标签标注场景下的医疗影像像素标注需求。

    一种基于关系抽取模型的样本优化方法及系统

    公开(公告)号:CN114996472B

    公开(公告)日:2025-04-25

    申请号:CN202210581933.9

    申请日:2022-05-26

    Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。

Patent Agency Ranking