一种跨病种迁移时病种数据结构化的方法及系统

    公开(公告)号:CN117809792A

    公开(公告)日:2024-04-02

    申请号:CN202410221624.X

    申请日:2024-02-28

    Abstract: 本发明涉及一种跨病种迁移时病种数据结构化的方法及系统;该方法包括:S1、构建问题库;S2、输出目标病种BERT语言模型和其它病种BERT语言模型;S3、过滤出目标病种句;S4、将目标病种句输入至目标病种BERT语言模型中,输出目标病种句向量;S5、得到目标病种已标注语料;S6、构造训练数据,将训练数据输入至初始分类模型中进行训练,得到训练分类模型;S7、得到目标病种结构化数据。本发明通过设置问题库,将病历和问题库结合输入至训练分类模型中,根据训练分类模型中的预测结果来提供结构化信息,从而得到较为精确和一致的病历数据整合结果,通过小批量样本标注以实现大批量样本标注的技术效果,能够满足跨病种迁移时的需求。

    一种基于知识图谱的脓毒症时序预测方法及系统

    公开(公告)号:CN117174319B

    公开(公告)日:2024-03-01

    申请号:CN202311452738.7

    申请日:2023-11-03

    Abstract: 本发明涉及一种基于知识图谱的脓毒症时序预测方法及系统;该方法包括:获取脓毒症患者的时序诊次信息,形成诊次数据集;基于CCS或ICD编码技术,构建医学本体图谱;基于医学本体图谱,构建目标脓毒症患者的诊次图谱;基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵;将诊次邻接矩阵和诊次特征矩阵分别输入至ST‑GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果。本发明通过将脓毒症患者患者的时序诊次信息和医学知识图谱相结合,实现全流程端到端预测,不仅有利于模型提取出患者更准确的表征,提升模型预测的准确性,还能够对大量减少医生的工作量,节省医疗资源。

    基于mq端口和redis数据库的模型训练方法及系统

    公开(公告)号:CN117349676A

    公开(公告)日:2024-01-05

    申请号:CN202311650060.3

    申请日:2023-12-05

    Abstract: 本发明提供了基于mq端口和redis数据库的模型训练方法及系统,该方法包括以下步骤:将现有医疗数据的数据格式进行统一,并作为训练集;利用训练集对预测模型进行训练;利用预测模型输出预测结果,将预测结果和审核结果存储于数据库并进行对比;若预测结果进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中;将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零。本发明将预测模型的输出结果进行存储以及发送人工审核,同时利用审核结果以及预测结果的对比,生成新的训练集,并对原预测模型进行重新训练。

    基于深度卷积网络控制门模型的用药推荐方法及系统

    公开(公告)号:CN116913459B

    公开(公告)日:2023-12-15

    申请号:CN202311171207.0

    申请日:2023-09-12

    Abstract: 本发明提供了基于深度卷积网络控制门模型的用药推荐方法及系统,该方法包括以下步骤:S1:获取现有的患者诊疗检查信息以及对应的最终用药数据;S2:根据患者诊疗检查信息与最终用药数据的对应关系,将每一条患者诊疗检查信息与最终用药数据进行数字ID映射的转化;S3:将转化为数字ID的患者诊疗信息作为输入,最终用药数据作为标签,输入控制门模型进行训练;S4:将实际患者诊疗信息输入控制门模型,输出建议用药概率。本发明通过深度卷积网络控制门模型学习已有的用户诊断检查数据,在训练完毕后,可以使用训练完毕的模型基于新的患者诊断检查检测指标对患者用药进行推荐,最终推荐出患者的最佳用药。

    基于人类反馈与强化学习的问答回复方法、系统及设备

    公开(公告)号:CN116955576A

    公开(公告)日:2023-10-27

    申请号:CN202311218911.7

    申请日:2023-09-21

    Abstract: 本发明涉及语言处理技术领域,特别提供一种基于人类反馈与强化学习的问答回复方法、系统及设备,该方法包括:基于目标数据,构造数据集,并基于数据集,对预训练模型进行继续预训练,得到初始问答模型;基于目标数据,构造三元组指令集数据;利用三元组指令集数据对初始问答模型进行优化,得到问答模型;基于目标数据,构造人类偏好指令集数据;基于人类偏好指令集数据,对问答模型进行训练,得到奖励模型;利用人类反馈强化学习机制,对奖励模型进行强化,得到问答回复模型,从而实现具备专业度较高的问答能力,以及具有回复人性化且专业准确性更高的特点。

    基于医学命名实体识别的数据增强方法及系统

    公开(公告)号:CN116894436A

    公开(公告)日:2023-10-17

    申请号:CN202311143040.7

    申请日:2023-09-06

    Abstract: 本发明公开了基于医学命名实体识别的数据增强方法及系统,本方案将标注好的医学文本数据进入bert模型后得到文本的向量表示,通过变分自编码算法(VAE),生成和原始文本相似的新的向量。为了保持原有的标注位置及标注信息,将生成的新向量与实体的起始、结束位置以及实体的长度向量进行叠加,最后送入模型进行训练,通过生成算法生成相似的向量,从而达到数据增强的效果,提升各类训练模型的泛化性能,进一步提高康复医学诊断、方案制定或者辅助治疗的效率。

    一种加快医学关系抽取的方法和装置

    公开(公告)号:CN116401381B

    公开(公告)日:2023-08-04

    申请号:CN202310670289.7

    申请日:2023-06-07

    Abstract: 本发明公开了一种加快医学关系抽取的方法和装置,对于pipeline的关系抽取方法,在实体预测抽取前,通过排序以及合并规则机制对待预测文本进行长度和数量处理,调整待预测文本的长度并精简预测批次,经过bert模型时,减少多头自注意力机制层花费的时间,提升预测效率和关系抽取效率;在医学关系抽取前,对构建实体对时的实体进行判断,对于相同的实体类型不进行特征构建,对于不同的实体类型进行分析,从而去掉相同类型的实体对和不应该是头实体的实体对,对构建的实体对进行轻量化处理,提升预测效率和关系抽取效率。

Patent Agency Ranking