一种基于提示学习模型的传染病预警直报方法和系统

    公开(公告)号:CN115631868B

    公开(公告)日:2023-04-21

    申请号:CN202211461585.8

    申请日:2022-11-17

    Abstract: 本发明提供了一种基于提示学习模型的传染病预警直报方法和系统,涉及医疗信息化技术领域,包括如下步骤:获取不同医院的原始诊断疾病数据,提取所述原始诊断疾病数据中的诊断描述;基于所述诊断描述构建诊断描述的集合;获取不同传染病的规范名称,基于所述规范名称构建传染病名称集合;基于语言模型对诊断描述的集合中的每个诊断描述与传染病名称集合中的每个规范名称进行比对,判断是否匹配,当任一诊断描述与任一规范名称判断为匹配时上报预警。避免了碍于各个地区的医生的诊断业务能力不同,对传染病进行个性化的诊断描述或自定义的诊断描述,导致传染病不能够被及时发现,提高了识别传染病的准确度。

    一种增强医疗语句语义向量表示的模型构造方法及系统

    公开(公告)号:CN115545041B

    公开(公告)日:2023-04-07

    申请号:CN202211488054.8

    申请日:2022-11-25

    Abstract: 本发明涉及自然语言处理技术领域,且公开了一种增强医疗语句语义向量表示的模型构造方法,包括收集医学领域的医疗数据,并对所述医疗数据进行预处理,建构一份扩充医学词典;基于所述医疗数据进行预处理结果,保留Bert中的MLM任务,构建损失函数做全词掩码训练;保存训练后的Bert模型,切分所述医疗数据中的每段文本形成句子集合;基于句子集合,对每个句子进行对比学习训练;构建一个新的损失函数,判断当新的损失函数连续3次得出的数据不下降的情况下,得出最终Bert模型作为最终的增强语义向量表示的模型。本专利结合继续预训练和对比学习来有效增强医疗语句语义表示的构造方法,使医疗语句的表达更精确。

    一种基于关系抽取模型的样本优化方法及系统

    公开(公告)号:CN114996472A

    公开(公告)日:2022-09-02

    申请号:CN202210581933.9

    申请日:2022-05-26

    Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。

    一种基于关系抽取模型的样本优化方法及系统

    公开(公告)号:CN114996472B

    公开(公告)日:2025-04-25

    申请号:CN202210581933.9

    申请日:2022-05-26

    Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。

    一种基于大模型的输入提示优化方法、系统、设备及介质

    公开(公告)号:CN119762874A

    公开(公告)日:2025-04-04

    申请号:CN202411923656.0

    申请日:2024-12-25

    Abstract: 本发明公开了一种基于大模型的输入提示优化方法、系统、设备及介质,涉及大模型优化训练技术领域,方法包括:获取训练预设大模型的原始输入提示集,并基于预训练模型对所述原始输入提示集进行处理得到优化后的原始输入提示集;所述预设大模型用于对待识别的机械图片进行处理得到所述待识别的机械图片对应的机械类型以及标识信息。本发明通过对原始输入提示集进行优化处理可以提升后续任一大模型的训练的精确度,此外,本方案通过预训练模型对原始输入提示集进行统一处理也能够提升处理效率。另外,预训练模型可以有针对性的为了优化出满足后续需求的输出结果,基于此可以灵活的调整对于预训练模型的训练方式或精度,使得本方案更具灵活性。

    一种大模型检索增强生成中关于文档切分效果评估的方法

    公开(公告)号:CN119761377A

    公开(公告)日:2025-04-04

    申请号:CN202411868956.3

    申请日:2024-12-18

    Abstract: 本发明公开了一种大模型检索增强生成中关于文档切分效果评估的方法,涉及文档切分技术领域,方法包括:获取待评估文档的进行切分处理后得到的切分对,按照顺序将切分对输入至通用语义模型中,得到每个切分对对应的目标评价值,基于评价值与效果等级对应关系,确定所有目标评价值对应的目标效果等级;通用语义模型的训练过程具体为:对训练文档进行切分得到至少两个原始切块;对任一原始切块进行随机切分,得到预设个数的切片;按照语义是否存在相关性进行标注,得到n组训练样本;计算任一组训练样本对应的目标相关性分数以及目标分离性分数,确定该训练样本对应的评价值。本发明可以反馈每个文档对应的分割效果的评分也可以有助于辅助文档切分。

Patent Agency Ranking