一种医学知识图谱质量评估方法及系统

    公开(公告)号:CN118035678A

    公开(公告)日:2024-05-14

    申请号:CN202410142915.X

    申请日:2024-02-01

    Abstract: 本发明涉及一种医学知识图谱质量评估方法及系统;该方法通过用户在前端发起对目标定义型医学知识图谱进行检测的Api请求,该Api请求通过http接口形式返回至后端服务器,后端服务器在接收该Api请求后开始调用知识图谱检测系统进行检测,基于形式检测、概念异常检测和关系一致性检测,以便对目标定义型医学知识图谱的状态和不足之处进行筛选,生成相应的质量检测结果,后端服务器将生成的质量检测结果再次通过HTTP接口形式返回至前端,用于展示质量检测结果,以供用户查看,通过查看质量检测结果,用户能够对目标定义型医学知识图谱的状态和不足之处认识和了解,以便下一步的修正,从而提高了定义型医学知识图谱内知识的准确性和可靠性。

    一种跨病种迁移时病种数据结构化的方法及系统

    公开(公告)号:CN117809792B

    公开(公告)日:2024-05-03

    申请号:CN202410221624.X

    申请日:2024-02-28

    Abstract: 本发明涉及一种跨病种迁移时病种数据结构化的方法及系统;该方法包括:S1、构建问题库;S2、输出目标病种BERT语言模型和其它病种BERT语言模型;S3、过滤出目标病种句;S4、将目标病种句输入至目标病种BERT语言模型中,输出目标病种句向量;S5、得到目标病种已标注语料;S6、构造训练数据,将训练数据输入至初始分类模型中进行训练,得到训练分类模型;S7、得到目标病种结构化数据。本发明通过设置问题库,将病历和问题库结合输入至训练分类模型中,根据训练分类模型中的预测结果来提供结构化信息,从而得到较为精确和一致的病历数据整合结果,通过小批量样本标注以实现大批量样本标注的技术效果,能够满足跨病种迁移时的需求。

    一种医学影像检查结果分析方法及装置

    公开(公告)号:CN117711635A

    公开(公告)日:2024-03-15

    申请号:CN202410162478.8

    申请日:2024-02-05

    Abstract: 本发明公开了一种医学影像检查结果分析方法及装置,通过深度学习技术、构建改进Trie树和微调后的疾病名称提取模型分别识别出第一类疾病分析实体、第二类疾病分析实体和第三类疾病分析实体,最终将三种结果进行融合后,再根据疾病语料库映射到ICD编码中,通过查询疾病专业知识库中的ICD编码,从而返回对应的疾病专业知识,解决了患者并不能很好的从检查结果中获取到更多关于疾病的信息的问题,帮助患者更好的了解自身病情,理性看待病情,有利于患者协助医生做出有针对性的诊疗,提高诊疗效率。

    基于mq端口和redis数据库的模型训练方法及系统

    公开(公告)号:CN117349676B

    公开(公告)日:2024-03-12

    申请号:CN202311650060.3

    申请日:2023-12-05

    Abstract: 本发明提供了基于mq端口和redis数据库的模型训练方法及系统,该方法包括以下步骤:将现有医疗数据的数据格式进行统一,并作为训练集;利用训练集对预测模型进行训练;利用预测模型输出预测结果,将预测结果和审核结果存储于数据库并进行对比;若预测结果进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中;将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零。本发明将预测模型的输出结果进行存储以及发送人工审核,同时利用审核结果以及预测结果的对比,生成新的训练集,并对原预测模型进行重新训练。

    基于自训练文本纠错和文本匹配的医学直报方法及系统

    公开(公告)号:CN116502629B

    公开(公告)日:2023-08-18

    申请号:CN202310735155.9

    申请日:2023-06-20

    Abstract: 本发明涉及疾病预警技术领域,具体为基于自训练文本纠错和文本匹配的医学直报方法及系统;本方法包括基于原始病历数据构造文本纠错模型的训练数据,得到缺字补充模型和错字纠错模型,将新输入数据通过模型进行文本纠错处理,将纠错处理过后的数据,使用bm25算法和jaccard算法计算与已有疾病标准名称知识库的相似度,选择相似度综合评分最大的已有疾病标准名称作为该新输入数据映射的标准疾病名称,与危险传染疾病数据库中的传染疾病名称进行直接匹配检索,若存在相应的数据,则判断当前疾病为危险传染病,将该疾病直接上报给机构,完成危险病直报;实现数据标准化,使得直报系统可以准确识别病症,克服系统不准确的问题。

    基于远程监督的实体识别方法及系统

    公开(公告)号:CN115859989A

    公开(公告)日:2023-03-28

    申请号:CN202310106608.1

    申请日:2023-02-13

    Abstract: 本发明提供了基于远程监督的实体识别方法及系统,包括以下步骤:S1:对目标语句进行分词处理;S2:将分词处理得到的词语与已有知识图谱中的实体进行匹配,并使用预训练bert模型对分词处理得到的词语与已有知识图谱中的实体是否匹配做二分类判别;S3:将能够与现有知识图谱中的实体匹配的词语作为输入数据,输入到深度学习模型LSTM进行实体抽取;S4:将每个词语从深度学习模型LSTM的输出结果与该词语与已有知识图谱中所对应的实体信息进行拼接,完成实体抽取。本发明提供的基于远程监督的实体识别方法及系统,能够在小领域场景中,充分利用现有的知识图谱信息,为实体抽取任务提供额外的特征知识,进而提高在小领域场景中的实体识别准确率。

    基于医学命名实体识别的持续学习的模型训练方法及装置

    公开(公告)号:CN115374787B

    公开(公告)日:2023-01-31

    申请号:CN202211294936.0

    申请日:2022-10-21

    Abstract: 本发明公开了基于医学命名实体识别的持续学习的模型训练方法及装置,通过在进行持续学习的模型训练过程中保留种子数据,在使用模型训练新数据时,和新数据一块进行模型训练,在训练得到的新模型具备旧知识后,让新模型能同时拥有新旧知识的能力,采取冻结第0、4、8层的bert层以及参数信息,让其不进行参数更新,保留之前学到的信息,降低旧知识的遗忘性,得到的训练结果遗忘率最低并且准确率最高,在医学领域中,可以既不需要全量的数据进行训练,又不会忘记在原始医院学到的知识,所以能将原始医院的模型适应到新医院进行训练,从而避免新医院进行大量文本标注,节约训练时间,提高训练效率和训练结果的准确率,让医学命名实体识别更为精准。

    一种增强医疗语句语义向量表示的模型构造方法及系统

    公开(公告)号:CN115545041A

    公开(公告)日:2022-12-30

    申请号:CN202211488054.8

    申请日:2022-11-25

    Abstract: 本发明涉及自然语言处理技术领域,且公开了一种增强医疗语句语义向量表示的模型构造方法,包括收集医学领域的医疗数据,并对所述医疗数据进行预处理,建构一份扩充医学词典;基于所述医疗数据进行预处理结果,保留Bert中的MLM任务,构建损失函数做全词掩码训练;保存训练后的Bert模型,切分所述医疗数据中的每段文本形成句子集合;基于句子集合,对每个句子进行对比学习训练;构建一个新的损失函数,判断当新的损失函数连续3次得出的数据不下降的情况下,得出最终Bert模型作为最终的增强语义向量表示的模型。本专利结合继续预训练和对比学习来有效增强医疗语句语义表示的构造方法,使医疗语句的表达更精确。

Patent Agency Ranking