-
公开(公告)号:CN114996472B
公开(公告)日:2025-04-25
申请号:CN202210581933.9
申请日:2022-05-26
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/36 , G06F18/214 , G16H10/60
Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。
-
公开(公告)号:CN114974490B
公开(公告)日:2024-11-05
申请号:CN202210589095.X
申请日:2022-05-27
Applicant: 神州医疗科技股份有限公司
IPC: G16H10/60 , G06F16/35 , G06F40/205 , G06F40/242 , G06F40/289 , G06F40/30
Abstract: 本公开的实施例公开了用于构建医学术语平台的方法、装置、电子设备和介质。该方法的一具体实施方式包括:选取数据源,采集医学词语集合;对上述医学词语集合进行数据处理,得到数据处理完成的医学词语集合;基于上述数据处理完成的医学词语集合,建立各个医学词语之间的关系;将关系建立完成的医学词语集合确定为目标医学术语集合,以及将上述目标医学术语集合发布至目标医学术语平台。该实施方式实现了医学信息命名规范、统一,即使有多个数据源也可以轻松处理得到符合要求的医学术语集合,构建的医学术语平台也有助于医学问诊、医学预警、医学指南推荐等医疗相关服务。
-
公开(公告)号:CN115080705A
公开(公告)日:2022-09-20
申请号:CN202210855091.1
申请日:2022-07-20
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/211 , G06F40/216 , G06F40/295
Abstract: 本发明涉及信息处理技术领域,且公开了基于双模型增强的垂直领域关系抽取方法及系统,本发明采用原始文本的实体信息配合设置双模型的方式,利用从垂直领域现有的知识图谱中的提取的属性信息文本进行关系抽取,最后结合双模型的关系抽取,能够在少量样本结合现有的知识图谱情况下,共同得出更准确的结果,节省大量的预训练计算资源。
-
公开(公告)号:CN115062118A
公开(公告)日:2022-09-16
申请号:CN202210886767.3
申请日:2022-07-26
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本公开的实施例公开了双通道信息抽取方法、装置、电子设备和介质。涉及计算机技术领域。该方法的一具体实施方式包括:获取输入文本;生成上述输入文本的文本向量;基于上述文本向量,抽取上述输入文本的语义信息;将上述语义信息传输至具有显示功能的目标设备。该实施方式利用生成输入文本的文本向量的方式来抽取语义信息,实现了针对输入文本的语义信息的有效抽取。
-
公开(公告)号:CN114974490A
公开(公告)日:2022-08-30
申请号:CN202210589095.X
申请日:2022-05-27
Applicant: 神州医疗科技股份有限公司
IPC: G16H10/60 , G06F16/35 , G06F40/205 , G06F40/242 , G06F40/289 , G06F40/30
Abstract: 本公开的实施例公开了用于构建医学术语平台的方法、装置、电子设备和介质。该方法的一具体实施方式包括:选取数据源,采集医学词语集合;对上述医学词语集合进行数据处理,得到数据处理完成的医学词语集合;基于上述数据处理完成的医学词语集合,建立各个医学词语之间的关系;将关系建立完成的医学词语集合确定为目标医学术语集合,以及将上述目标医学术语集合发布至目标医学术语平台。该实施方式实现了医学信息命名规范、统一,即使有多个数据源也可以轻松处理得到符合要求的医学术语集合,构建的医学术语平台也有助于医学问诊、医学预警、医学指南推荐等医疗相关服务。
-
公开(公告)号:CN115062118B
公开(公告)日:2023-01-31
申请号:CN202210886767.3
申请日:2022-07-26
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本公开的实施例公开了双通道信息抽取方法、装置、电子设备和介质。涉及计算机技术领域。该方法的一具体实施方式包括:获取输入文本;生成上述输入文本的文本向量;基于上述文本向量,抽取上述输入文本的语义信息;将上述语义信息传输至具有显示功能的目标设备。该实施方式利用生成输入文本的文本向量的方式来抽取语义信息,实现了针对输入文本的语义信息的有效抽取。
-
公开(公告)号:CN114969386B
公开(公告)日:2022-11-18
申请号:CN202210926041.8
申请日:2022-08-03
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/36 , G06N3/04 , G06F16/31 , G06F40/289 , G06F40/295 , G16H50/20
Abstract: 本公开的实施例公开了应用于医学领域的消歧方法、装置、电子设备和介质,涉及医疗知识图谱构建技术领域。该方法的一具体实施方式包括:获取医学知识图谱和待消歧数据;基于上述医学知识图谱,对上述待消歧数据进行消歧处理,得到新的医学知识图谱;将上述新的医学知识图谱存储至目标医学信息平台的数据库。该实施方式实现了对待消歧数据的有效消歧,为医学知识图谱的更新、构建提供了重要帮助。
-
公开(公告)号:CN114996472A
公开(公告)日:2022-09-02
申请号:CN202210581933.9
申请日:2022-05-26
Applicant: 神州医疗科技股份有限公司
Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。
-
公开(公告)号:CN115080764B
公开(公告)日:2022-11-01
申请号:CN202210856458.1
申请日:2022-07-21
Applicant: 神州医疗科技股份有限公司
Abstract: 本发明涉及知识图谱技术领域,具体涉及基于知识图谱及聚类算法的医学相似实体分类方法及系统,本方法包括将医学数据库的数据构成三元组数据集,将三元组数据集作为训练集,对知识图谱学习模型进行训练,得到医学数据库的向量化表示的医学知识图谱,将其三元组通过均值池化层获得三元组的代表向量,利用无监督聚类算法Kmeans对实体和关系的代表向量进行聚类,得出医学知识图谱内的相似术语实体库,将同一簇内的实体作为正样本,将不同簇内的实体作为负样本,将正样本和负样本输入,训练实体相似分类模型,基于实体相似分类模型对实体进行相似判断;本发明解决人工标注相似实体分类繁琐的问题,实现对医学知识图谱无人工的准确构建。
-
公开(公告)号:CN115048934A
公开(公告)日:2022-09-13
申请号:CN202210663574.1
申请日:2022-06-13
Applicant: 神州医疗科技股份有限公司
IPC: G06F40/295 , G06F16/36 , G06N20/00
Abstract: 本申请公开了一种知识图谱构建过程中命名实体识别模型的训练方法和系统,包括:步骤S1、构建种子训练集;步骤S2、利用种子训练集对命名实体识别模型进行训练,更新命名实体识别模型;步骤S3、基于更新的命名实体识别模型对输入样本进行识别,生成样本识别结果;步骤S4、基于样本识别结果中的模糊命名实体更新种子训练集;步骤S5、重复步骤S2‑步骤S4,直至样本识别结果中无模糊命名实体,训练结束。本申请公开的知识图谱构建过程中命名实体识别模型的训练方法和系统,通过半监督学习的方法,提高了知识图谱构建过程中对命名实体的识别准确度,减少了人工工作量,降低了人工成本。
-
-
-
-
-
-
-
-
-