基于医学命名实体识别的数据增强方法及系统

    公开(公告)号:CN116894436B

    公开(公告)日:2023-12-15

    申请号:CN202311143040.7

    申请日:2023-09-06

    Abstract: 本发明公开了基于医学命名实体识别的数据增强方法及系统,本方案将标注好的医学文本数据进入bert模型后得到文本的向量表示,通过变分自编码算法(VAE),生成和原始文本相似的新的向量。为了保持原有的标注位置及标注信息,将生成的新向量与实体的起始、结束位置以及实体的长度向量进行叠加,最后送入模型进行训练,通过生成算法生成相似的向量,从而达到数据增强的效果,提升各类训练模型的泛化性能,进一步提高康复医学诊断、方案制定或者辅助治疗的效率。

    基于深度卷积网络控制门模型的用药推荐方法及系统

    公开(公告)号:CN116913459A

    公开(公告)日:2023-10-20

    申请号:CN202311171207.0

    申请日:2023-09-12

    Abstract: 本发明提供了基于深度卷积网络控制门模型的用药推荐方法及系统,该方法包括以下步骤:S1:获取现有的患者诊疗检查信息以及对应的最终用药数据;S2:根据患者诊疗检查信息与最终用药数据的对应关系,将每一条患者诊疗检查信息与最终用药数据进行数字ID映射的转化;S3:将转化为数字ID的患者诊疗信息作为输入,最终用药数据作为标签,输入控制门模型进行训练;S4:将实际患者诊疗信息输入控制门模型,输出建议用药概率。本发明通过深度卷积网络控制门模型学习已有的用户诊断检查数据,在训练完毕后,可以使用训练完毕的模型基于新的患者诊断检查检测指标对患者用药进行推荐,最终推荐出患者的最佳用药。

    一种基于提示学习模型的传染病预警直报方法和系统

    公开(公告)号:CN115631868B

    公开(公告)日:2023-04-21

    申请号:CN202211461585.8

    申请日:2022-11-17

    Abstract: 本发明提供了一种基于提示学习模型的传染病预警直报方法和系统,涉及医疗信息化技术领域,包括如下步骤:获取不同医院的原始诊断疾病数据,提取所述原始诊断疾病数据中的诊断描述;基于所述诊断描述构建诊断描述的集合;获取不同传染病的规范名称,基于所述规范名称构建传染病名称集合;基于语言模型对诊断描述的集合中的每个诊断描述与传染病名称集合中的每个规范名称进行比对,判断是否匹配,当任一诊断描述与任一规范名称判断为匹配时上报预警。避免了碍于各个地区的医生的诊断业务能力不同,对传染病进行个性化的诊断描述或自定义的诊断描述,导致传染病不能够被及时发现,提高了识别传染病的准确度。

    一种增强医疗语句语义向量表示的模型构造方法及系统

    公开(公告)号:CN115545041B

    公开(公告)日:2023-04-07

    申请号:CN202211488054.8

    申请日:2022-11-25

    Abstract: 本发明涉及自然语言处理技术领域,且公开了一种增强医疗语句语义向量表示的模型构造方法,包括收集医学领域的医疗数据,并对所述医疗数据进行预处理,建构一份扩充医学词典;基于所述医疗数据进行预处理结果,保留Bert中的MLM任务,构建损失函数做全词掩码训练;保存训练后的Bert模型,切分所述医疗数据中的每段文本形成句子集合;基于句子集合,对每个句子进行对比学习训练;构建一个新的损失函数,判断当新的损失函数连续3次得出的数据不下降的情况下,得出最终Bert模型作为最终的增强语义向量表示的模型。本专利结合继续预训练和对比学习来有效增强医疗语句语义表示的构造方法,使医疗语句的表达更精确。

    一种基于关系抽取模型的样本优化方法及系统

    公开(公告)号:CN114996472A

    公开(公告)日:2022-09-02

    申请号:CN202210581933.9

    申请日:2022-05-26

    Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。

    一种大模型检索增强生成的自适应切片的文档切分方法

    公开(公告)号:CN119903834A

    公开(公告)日:2025-04-29

    申请号:CN202411887946.4

    申请日:2024-12-20

    Abstract: 本发明公开了一种大模型检索增强生成的自适应切片的文档切分方法,涉及大模型检索增强生成技术领域,方法包括:获取待切分文档,并对所述待切分文档按照标题类型进行切分,得到至少一组原始切块;根据任一原始切块对应的信息密度以及主题变化度,计算该原始切块的最优切分数量;根据所述最优切分数量对该原始切块进行切分处理。本发明先将文档按照层次标题进行切分,然后计算层次标题下的信息密度和主题变化度,以层级标题为单位,自动计算该层级标题下的最优切分大小,来指导文档的自适应切分,以提高后续检索和生成任务的效果。

    基于融合注意力与动态卷积的机械图片数据集生成方法

    公开(公告)号:CN119888401A

    公开(公告)日:2025-04-25

    申请号:CN202411912230.5

    申请日:2024-12-24

    Abstract: 本发明公开了基于融合注意力与动态卷积的机械图片数据集生成方法,涉及大模型技术领域,方法包括:获取至少一张待识别机械图像,将所有待识别机械图像输入至大模型处理模块,生成每张待识别机械图像对应的机械类型以及标注信息;将所述机械类型、所述标注信息以及对应的待识别机械图像进行关联,生成一组数据信息,将所有组数据信息进行整合生成机械图片数据集;所述大模型处理模块包括多模态融合层、动态注意力机制层以及融合注意力与动态卷积的时空增强网络模块。本发明能够通过大模型处理模块可以自动从原始机械图像中提取、整理并标注出机械图片数据集,提高数据集生成的效率和准确性。

Patent Agency Ranking