一种基于关系抽取模型的样本优化方法及系统

    公开(公告)号:CN114996472B

    公开(公告)日:2025-04-25

    申请号:CN202210581933.9

    申请日:2022-05-26

    Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。

    用于构建医学术语平台的方法、装置、电子设备和介质

    公开(公告)号:CN114974490B

    公开(公告)日:2024-11-05

    申请号:CN202210589095.X

    申请日:2022-05-27

    Abstract: 本公开的实施例公开了用于构建医学术语平台的方法、装置、电子设备和介质。该方法的一具体实施方式包括:选取数据源,采集医学词语集合;对上述医学词语集合进行数据处理,得到数据处理完成的医学词语集合;基于上述数据处理完成的医学词语集合,建立各个医学词语之间的关系;将关系建立完成的医学词语集合确定为目标医学术语集合,以及将上述目标医学术语集合发布至目标医学术语平台。该实施方式实现了医学信息命名规范、统一,即使有多个数据源也可以轻松处理得到符合要求的医学术语集合,构建的医学术语平台也有助于医学问诊、医学预警、医学指南推荐等医疗相关服务。

    用于构建医学术语平台的方法、装置、电子设备和介质

    公开(公告)号:CN114974490A

    公开(公告)日:2022-08-30

    申请号:CN202210589095.X

    申请日:2022-05-27

    Abstract: 本公开的实施例公开了用于构建医学术语平台的方法、装置、电子设备和介质。该方法的一具体实施方式包括:选取数据源,采集医学词语集合;对上述医学词语集合进行数据处理,得到数据处理完成的医学词语集合;基于上述数据处理完成的医学词语集合,建立各个医学词语之间的关系;将关系建立完成的医学词语集合确定为目标医学术语集合,以及将上述目标医学术语集合发布至目标医学术语平台。该实施方式实现了医学信息命名规范、统一,即使有多个数据源也可以轻松处理得到符合要求的医学术语集合,构建的医学术语平台也有助于医学问诊、医学预警、医学指南推荐等医疗相关服务。

    一种基于关系抽取模型的样本优化方法及系统

    公开(公告)号:CN114996472A

    公开(公告)日:2022-09-02

    申请号:CN202210581933.9

    申请日:2022-05-26

    Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。

    基于知识图谱及聚类算法的医学相似实体分类方法及系统

    公开(公告)号:CN115080764B

    公开(公告)日:2022-11-01

    申请号:CN202210856458.1

    申请日:2022-07-21

    Abstract: 本发明涉及知识图谱技术领域,具体涉及基于知识图谱及聚类算法的医学相似实体分类方法及系统,本方法包括将医学数据库的数据构成三元组数据集,将三元组数据集作为训练集,对知识图谱学习模型进行训练,得到医学数据库的向量化表示的医学知识图谱,将其三元组通过均值池化层获得三元组的代表向量,利用无监督聚类算法Kmeans对实体和关系的代表向量进行聚类,得出医学知识图谱内的相似术语实体库,将同一簇内的实体作为正样本,将不同簇内的实体作为负样本,将正样本和负样本输入,训练实体相似分类模型,基于实体相似分类模型对实体进行相似判断;本发明解决人工标注相似实体分类繁琐的问题,实现对医学知识图谱无人工的准确构建。

    知识图谱构建过程中命名实体识别模型的训练方法和系统

    公开(公告)号:CN115048934A

    公开(公告)日:2022-09-13

    申请号:CN202210663574.1

    申请日:2022-06-13

    Abstract: 本申请公开了一种知识图谱构建过程中命名实体识别模型的训练方法和系统,包括:步骤S1、构建种子训练集;步骤S2、利用种子训练集对命名实体识别模型进行训练,更新命名实体识别模型;步骤S3、基于更新的命名实体识别模型对输入样本进行识别,生成样本识别结果;步骤S4、基于样本识别结果中的模糊命名实体更新种子训练集;步骤S5、重复步骤S2‑步骤S4,直至样本识别结果中无模糊命名实体,训练结束。本申请公开的知识图谱构建过程中命名实体识别模型的训练方法和系统,通过半监督学习的方法,提高了知识图谱构建过程中对命名实体的识别准确度,减少了人工工作量,降低了人工成本。

Patent Agency Ranking