一种数据处理方法、装置、电子设备及计算机存储介质

    公开(公告)号:CN119848538A

    公开(公告)日:2025-04-18

    申请号:CN202411829906.4

    申请日:2024-12-12

    Abstract: 本发明涉及一种数据处理方法、装置、电子设备及计算机存储介质,该方法包括:获取针对目标领域的待处理数据;根据预训练的目标分类模型,对所述待处理数据进行分类处理,得到所述待处理数据的分类结果,其中,所述目标分类模型是基于小数据量的第一训练集、第一网络确定的初始累计梯度,以及基于初始累计梯度、第二网络的初始权重矩阵和小数据量的第二训练集确定的第二权重矩阵训练得到的。通过本发明的方法,可基于小数据量的训练样本,对目标网络进行微调,训练得到目标分类模型,以使得到的目标分类模型可准确的对目标领域的待处理数据进行准确的分类。

    一种基于知识图谱的大模型回答效果评估方法及系统

    公开(公告)号:CN119537561A

    公开(公告)日:2025-02-28

    申请号:CN202510106809.0

    申请日:2025-01-23

    Abstract: 本发明公开了一种基于知识图谱的大模型回答效果评估方法及系统,涉及大语言模型领域。公开了将多个问句进行预处理;预处理后的句子通过卷积计算得到关键词节点;通过关键词节点提取关键词属性;根据每个关键词节点的关键词属性的注意力影响分数,对各关键词属性进行筛选;使用筛选后的关键词属性构建上下文图,并经过多层感知机对关键词节点进行分类,得到多组关键词头节点和关键词尾节点;利用关键词节点为实体,分类结果为实体关系生成关键词知识图谱;将用户输入的问句通过大模型进行问答;对大模型的结果进行评测。本发明能够自动评估问答系统的回答效果,提高评估的效率和准确性。

    应用于医学领域的词语标准化方法、装置和电子设备

    公开(公告)号:CN115062614B

    公开(公告)日:2024-09-24

    申请号:CN202210939116.6

    申请日:2022-08-05

    Abstract: 本公开的实施例公开了应用于医学领域的词语标准化方法、装置和电子设备。涉及医疗服务领域。该方法的一具体实施方式包括:获取待标准化词语;将待标准化词语输入至预先训练的语言处理模型,生成待标准化词语的空间向量;基于待标准化词语、空间向量,计算待标准化词语与预设标准词语库中至少一个标准词语中每个标准词语之间的相似度,得到相似度集合;基于相似度集合,从预设标准词语库中选择出目标标准词语。该实施方式可以通过生成待标准化词语的空间向量,计算与预设标准词语库中每个标准词语之间的相似度集合,选择出待标准化词语对应的目标标准词语。提高了医学词语标准化的效率和准确度,为医疗数据被应用提供了重要帮助。

    基于计算特征网络的精准医学信息结论生成方法

    公开(公告)号:CN117763140B

    公开(公告)日:2024-05-28

    申请号:CN202410196621.5

    申请日:2024-02-22

    Abstract: 本发明涉及一种基于计算特征网络的精准医学信息结论生成方法,该方法包括:步骤S10、获取医学论文的文本信息;步骤S20、构建基于摘要部分和结论部分的训练集和验证集;步骤S30、将训练集输入计算网络中进行结论输出模型训练;步骤S40、在利用完成训练的结论输出模型进行结论输出得到输出结果后,基于用户对所述输出结果的修正,优化所述结论输出模型。本发明,能够更好的基于医学论文的摘要部分得到对应的结论,减少人工阅读的繁琐工序,帮助用户得到逻辑更严密、表达清晰、更直观的结论,有利于提高效率。

    基于医学命名实体识别的数据增强方法及系统

    公开(公告)号:CN116894436B

    公开(公告)日:2023-12-15

    申请号:CN202311143040.7

    申请日:2023-09-06

    Abstract: 本发明公开了基于医学命名实体识别的数据增强方法及系统,本方案将标注好的医学文本数据进入bert模型后得到文本的向量表示,通过变分自编码算法(VAE),生成和原始文本相似的新的向量。为了保持原有的标注位置及标注信息,将生成的新向量与实体的起始、结束位置以及实体的长度向量进行叠加,最后送入模型进行训练,通过生成算法生成相似的向量,从而达到数据增强的效果,提升各类训练模型的泛化性能,进一步提高康复医学诊断、方案制定或者辅助治疗的效率。

    基于深度卷积网络控制门模型的用药推荐方法及系统

    公开(公告)号:CN116913459A

    公开(公告)日:2023-10-20

    申请号:CN202311171207.0

    申请日:2023-09-12

    Abstract: 本发明提供了基于深度卷积网络控制门模型的用药推荐方法及系统,该方法包括以下步骤:S1:获取现有的患者诊疗检查信息以及对应的最终用药数据;S2:根据患者诊疗检查信息与最终用药数据的对应关系,将每一条患者诊疗检查信息与最终用药数据进行数字ID映射的转化;S3:将转化为数字ID的患者诊疗信息作为输入,最终用药数据作为标签,输入控制门模型进行训练;S4:将实际患者诊疗信息输入控制门模型,输出建议用药概率。本发明通过深度卷积网络控制门模型学习已有的用户诊断检查数据,在训练完毕后,可以使用训练完毕的模型基于新的患者诊断检查检测指标对患者用药进行推荐,最终推荐出患者的最佳用药。

    一种异步队列任务的报错处理方法及系统

    公开(公告)号:CN116501533B

    公开(公告)日:2023-08-25

    申请号:CN202310759103.5

    申请日:2023-06-26

    Abstract: 本发明提供了一种异步队列任务的报错处理方法及系统,该方法包括以下步骤:S1:将诊断文本进行分组预处理,并存入消息队列中;S2:从消息队列中逐组取出消息,并通过API接口压入第一数据库中;S3:异步任务开启,从第一数据库获取队列消息,解析后送入到抽取模型中执行关系抽取任务,若执行失败,则向第二数据库写入识别键值;S4:继续获取队列消息,并判断识别键值是否与当前消息的键对应,若对应,则当前消息跳过关系抽取任务;S5:重复S3‑S4步骤,直到消息处理完毕。本发明所提供的一种异步队列任务的报错处理方法及系统,通过获取异常任务的任务ID+时间戳作为唯一标识,从而判断后续任务是否可以直接跳过不处理,进而达到减少消息处理时间的目的。

    一种基于提示学习模型的传染病预警直报方法和系统

    公开(公告)号:CN115631868B

    公开(公告)日:2023-04-21

    申请号:CN202211461585.8

    申请日:2022-11-17

    Abstract: 本发明提供了一种基于提示学习模型的传染病预警直报方法和系统,涉及医疗信息化技术领域,包括如下步骤:获取不同医院的原始诊断疾病数据,提取所述原始诊断疾病数据中的诊断描述;基于所述诊断描述构建诊断描述的集合;获取不同传染病的规范名称,基于所述规范名称构建传染病名称集合;基于语言模型对诊断描述的集合中的每个诊断描述与传染病名称集合中的每个规范名称进行比对,判断是否匹配,当任一诊断描述与任一规范名称判断为匹配时上报预警。避免了碍于各个地区的医生的诊断业务能力不同,对传染病进行个性化的诊断描述或自定义的诊断描述,导致传染病不能够被及时发现,提高了识别传染病的准确度。

Patent Agency Ranking