基于医学命名实体识别的数据增强方法及系统

    公开(公告)号:CN116894436A

    公开(公告)日:2023-10-17

    申请号:CN202311143040.7

    申请日:2023-09-06

    Abstract: 本发明公开了基于医学命名实体识别的数据增强方法及系统,本方案将标注好的医学文本数据进入bert模型后得到文本的向量表示,通过变分自编码算法(VAE),生成和原始文本相似的新的向量。为了保持原有的标注位置及标注信息,将生成的新向量与实体的起始、结束位置以及实体的长度向量进行叠加,最后送入模型进行训练,通过生成算法生成相似的向量,从而达到数据增强的效果,提升各类训练模型的泛化性能,进一步提高康复医学诊断、方案制定或者辅助治疗的效率。

    基于自训练文本纠错和文本匹配的医学直报方法及系统

    公开(公告)号:CN116502629A

    公开(公告)日:2023-07-28

    申请号:CN202310735155.9

    申请日:2023-06-20

    Abstract: 本发明涉及疾病预警技术领域,具体为基于自训练文本纠错和文本匹配的医学直报方法及系统;本方法包括基于原始病历数据构造文本纠错模型的训练数据,得到缺字补充模型和错字纠错模型,将新输入数据通过模型进行文本纠错处理,将纠错处理过后的数据,使用bm25算法和jaccard算法计算与已有疾病标准名称知识库的相似度,选择相似度综合评分最大的已有疾病标准名称作为该新输入数据映射的标准疾病名称,与危险传染疾病数据库中的传染疾病名称进行直接匹配检索,若存在相应的数据,则判断当前疾病为危险传染病,将该疾病直接上报给机构,完成危险病直报;实现数据标准化,使得直报系统可以准确识别病症,克服系统不准确的问题。

    一种数据处理方法、装置、电子设备及计算机存储介质

    公开(公告)号:CN119848538A

    公开(公告)日:2025-04-18

    申请号:CN202411829906.4

    申请日:2024-12-12

    Abstract: 本发明涉及一种数据处理方法、装置、电子设备及计算机存储介质,该方法包括:获取针对目标领域的待处理数据;根据预训练的目标分类模型,对所述待处理数据进行分类处理,得到所述待处理数据的分类结果,其中,所述目标分类模型是基于小数据量的第一训练集、第一网络确定的初始累计梯度,以及基于初始累计梯度、第二网络的初始权重矩阵和小数据量的第二训练集确定的第二权重矩阵训练得到的。通过本发明的方法,可基于小数据量的训练样本,对目标网络进行微调,训练得到目标分类模型,以使得到的目标分类模型可准确的对目标领域的待处理数据进行准确的分类。

    一种基于知识图谱的大模型回答效果评估方法及系统

    公开(公告)号:CN119537561A

    公开(公告)日:2025-02-28

    申请号:CN202510106809.0

    申请日:2025-01-23

    Abstract: 本发明公开了一种基于知识图谱的大模型回答效果评估方法及系统,涉及大语言模型领域。公开了将多个问句进行预处理;预处理后的句子通过卷积计算得到关键词节点;通过关键词节点提取关键词属性;根据每个关键词节点的关键词属性的注意力影响分数,对各关键词属性进行筛选;使用筛选后的关键词属性构建上下文图,并经过多层感知机对关键词节点进行分类,得到多组关键词头节点和关键词尾节点;利用关键词节点为实体,分类结果为实体关系生成关键词知识图谱;将用户输入的问句通过大模型进行问答;对大模型的结果进行评测。本发明能够自动评估问答系统的回答效果,提高评估的效率和准确性。

    应用于医学领域的词语标准化方法、装置和电子设备

    公开(公告)号:CN115062614B

    公开(公告)日:2024-09-24

    申请号:CN202210939116.6

    申请日:2022-08-05

    Abstract: 本公开的实施例公开了应用于医学领域的词语标准化方法、装置和电子设备。涉及医疗服务领域。该方法的一具体实施方式包括:获取待标准化词语;将待标准化词语输入至预先训练的语言处理模型,生成待标准化词语的空间向量;基于待标准化词语、空间向量,计算待标准化词语与预设标准词语库中至少一个标准词语中每个标准词语之间的相似度,得到相似度集合;基于相似度集合,从预设标准词语库中选择出目标标准词语。该实施方式可以通过生成待标准化词语的空间向量,计算与预设标准词语库中每个标准词语之间的相似度集合,选择出待标准化词语对应的目标标准词语。提高了医学词语标准化的效率和准确度,为医疗数据被应用提供了重要帮助。

    基于计算特征网络的精准医学信息结论生成方法

    公开(公告)号:CN117763140B

    公开(公告)日:2024-05-28

    申请号:CN202410196621.5

    申请日:2024-02-22

    Abstract: 本发明涉及一种基于计算特征网络的精准医学信息结论生成方法,该方法包括:步骤S10、获取医学论文的文本信息;步骤S20、构建基于摘要部分和结论部分的训练集和验证集;步骤S30、将训练集输入计算网络中进行结论输出模型训练;步骤S40、在利用完成训练的结论输出模型进行结论输出得到输出结果后,基于用户对所述输出结果的修正,优化所述结论输出模型。本发明,能够更好的基于医学论文的摘要部分得到对应的结论,减少人工阅读的繁琐工序,帮助用户得到逻辑更严密、表达清晰、更直观的结论,有利于提高效率。

    一种基于强化学习和迁移学习的命名实体识别方法和装置

    公开(公告)号:CN117744660A

    公开(公告)日:2024-03-22

    申请号:CN202410182078.3

    申请日:2024-02-19

    Abstract: 本申请提供了一种基于强化学习和迁移学习的命名实体识别方法和装置,所述方法包括:利用每个高概率预测错误数据对应的第一转换数据以及预设分数对文本打分原始模型进行强化学习训练,得到文本打分模型;将已标注文本数据的第二转换数据输入到文本打分模型中,确定出已标注文本数据对应的文本分数;利用每个已标注文本数据对应的文本分数对源域命名实体识别模型进行迁移学习,以得到目标域对应的目标域命名实体识别模型将目标域对应的医学文本数据输入到目标域命名实体识别模型中,得到目标域命名实体识别模型对医学文本数据进行实体识别的结果。通过方法及装置,提升了命名实体识别模型在目标域的实体识别准确性。

Patent Agency Ranking