一种加快医学关系抽取的方法和装置

    公开(公告)号:CN116401381A

    公开(公告)日:2023-07-07

    申请号:CN202310670289.7

    申请日:2023-06-07

    Abstract: 本发明公开了一种加快医学关系抽取的方法和装置,对于pipeline的关系抽取方法,在实体预测抽取前,通过排序以及合并规则机制对待预测文本进行长度和数量处理,调整待预测文本的长度并精简预测批次,经过bert模型时,减少多头自注意力机制层花费的时间,提升预测效率和关系抽取效率;在医学关系抽取前,对构建实体对时的实体进行判断,对于相同的实体类型不进行特征构建,对于不同的实体类型进行分析,从而去掉相同类型的实体对和不应该是头实体的实体对,对构建的实体对进行轻量化处理,提升预测效率和关系抽取效率。

    基于知识图谱及聚类算法的医学相似实体分类方法及系统

    公开(公告)号:CN115080764B

    公开(公告)日:2022-11-01

    申请号:CN202210856458.1

    申请日:2022-07-21

    Abstract: 本发明涉及知识图谱技术领域,具体涉及基于知识图谱及聚类算法的医学相似实体分类方法及系统,本方法包括将医学数据库的数据构成三元组数据集,将三元组数据集作为训练集,对知识图谱学习模型进行训练,得到医学数据库的向量化表示的医学知识图谱,将其三元组通过均值池化层获得三元组的代表向量,利用无监督聚类算法Kmeans对实体和关系的代表向量进行聚类,得出医学知识图谱内的相似术语实体库,将同一簇内的实体作为正样本,将不同簇内的实体作为负样本,将正样本和负样本输入,训练实体相似分类模型,基于实体相似分类模型对实体进行相似判断;本发明解决人工标注相似实体分类繁琐的问题,实现对医学知识图谱无人工的准确构建。

    知识图谱构建过程中命名实体识别模型的训练方法和系统

    公开(公告)号:CN115048934A

    公开(公告)日:2022-09-13

    申请号:CN202210663574.1

    申请日:2022-06-13

    Abstract: 本申请公开了一种知识图谱构建过程中命名实体识别模型的训练方法和系统,包括:步骤S1、构建种子训练集;步骤S2、利用种子训练集对命名实体识别模型进行训练,更新命名实体识别模型;步骤S3、基于更新的命名实体识别模型对输入样本进行识别,生成样本识别结果;步骤S4、基于样本识别结果中的模糊命名实体更新种子训练集;步骤S5、重复步骤S2‑步骤S4,直至样本识别结果中无模糊命名实体,训练结束。本申请公开的知识图谱构建过程中命名实体识别模型的训练方法和系统,通过半监督学习的方法,提高了知识图谱构建过程中对命名实体的识别准确度,减少了人工工作量,降低了人工成本。

    一种医学标准映射模型的建立方法、系统及使用方法

    公开(公告)号:CN114996466A

    公开(公告)日:2022-09-02

    申请号:CN202210918247.6

    申请日:2022-08-01

    Abstract: 本发明涉及智慧医疗技术领域,且公开了一种医学标准映射模型的建立方法、系统及使用方法,本发明能够将医学实体数据按照原始词、标准词、标准词编码的类型进行准确的分类,并对分类后的训练数据进行预处理,从而得到统一化的实体数据集;利用统一化的实体数据集作为Bert模型的输入能够减少训练误差,且实体数据集是按照锚文本、正文本和负文本组成的三元组样本的形式进行划分,并能够提高特征向量获取的准确性,加强各文本的特征向量的联系性;同时,通过损失函数的计算和预设条件的设置,能够及时的停止Bert模型的训练,从而获取较准确的医学标准映射模型。

Patent Agency Ranking