一种增强医疗语句语义向量表示的模型构造方法及系统

    公开(公告)号:CN115545041B

    公开(公告)日:2023-04-07

    申请号:CN202211488054.8

    申请日:2022-11-25

    Abstract: 本发明涉及自然语言处理技术领域,且公开了一种增强医疗语句语义向量表示的模型构造方法,包括收集医学领域的医疗数据,并对所述医疗数据进行预处理,建构一份扩充医学词典;基于所述医疗数据进行预处理结果,保留Bert中的MLM任务,构建损失函数做全词掩码训练;保存训练后的Bert模型,切分所述医疗数据中的每段文本形成句子集合;基于句子集合,对每个句子进行对比学习训练;构建一个新的损失函数,判断当新的损失函数连续3次得出的数据不下降的情况下,得出最终Bert模型作为最终的增强语义向量表示的模型。本专利结合继续预训练和对比学习来有效增强医疗语句语义表示的构造方法,使医疗语句的表达更精确。

    一种基于关系抽取模型的样本优化方法及系统

    公开(公告)号:CN114996472A

    公开(公告)日:2022-09-02

    申请号:CN202210581933.9

    申请日:2022-05-26

    Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。

    基于人类反馈与强化学习的问答回复方法、系统及设备

    公开(公告)号:CN116955576B

    公开(公告)日:2024-07-02

    申请号:CN202311218911.7

    申请日:2023-09-21

    Abstract: 本发明涉及语言处理技术领域,特别提供一种基于人类反馈与强化学习的问答回复方法、系统及设备,该方法包括:基于目标数据,构造数据集,并基于数据集,对预训练模型进行继续预训练,得到初始问答模型;基于目标数据,构造三元组指令集数据;利用三元组指令集数据对初始问答模型进行优化,得到问答模型;基于目标数据,构造人类偏好指令集数据;基于人类偏好指令集数据,对问答模型进行训练,得到奖励模型;利用人类反馈强化学习机制,对奖励模型进行强化,得到问答回复模型,从而实现具备专业度较高的问答能力,以及具有回复人性化且专业准确性更高的特点。

    一种医学领域中的强化学习数据构建方法及系统

    公开(公告)号:CN117764204B

    公开(公告)日:2024-06-07

    申请号:CN202410191910.6

    申请日:2024-02-21

    Abstract: 本发明涉及医学数据构建技术领域,尤其涉及一种医学领域中的强化学习数据构建方法及系统;该方法包括:获取原始电子病例;对原始电子病例进行数据脱敏处理,得到脱敏数据集;对脱敏数据集进行实体标注和关系标注,构建状态集;构建预测集;对症状词语/症状关系词组与开源大模型答案进行人工校验,将正确的校验结果和对应的检查项价格进行标注,构建核对集;对检查项价格进行规整处理;构建强化学习数据集;基于该强化学习数据集,便于开展后续相关的强化学习,同时能够根据给定的病症或其它结果推荐价格较低的检查项目,以便为医生和患者在医学辅助诊断推荐决策中提供合适的推荐选择,降低医疗成本,提高医疗效果。

    一种跨病种迁移时病种数据结构化的方法及系统

    公开(公告)号:CN117809792A

    公开(公告)日:2024-04-02

    申请号:CN202410221624.X

    申请日:2024-02-28

    Abstract: 本发明涉及一种跨病种迁移时病种数据结构化的方法及系统;该方法包括:S1、构建问题库;S2、输出目标病种BERT语言模型和其它病种BERT语言模型;S3、过滤出目标病种句;S4、将目标病种句输入至目标病种BERT语言模型中,输出目标病种句向量;S5、得到目标病种已标注语料;S6、构造训练数据,将训练数据输入至初始分类模型中进行训练,得到训练分类模型;S7、得到目标病种结构化数据。本发明通过设置问题库,将病历和问题库结合输入至训练分类模型中,根据训练分类模型中的预测结果来提供结构化信息,从而得到较为精确和一致的病历数据整合结果,通过小批量样本标注以实现大批量样本标注的技术效果,能够满足跨病种迁移时的需求。

    基于mq端口和redis数据库的模型训练方法及系统

    公开(公告)号:CN117349676A

    公开(公告)日:2024-01-05

    申请号:CN202311650060.3

    申请日:2023-12-05

    Abstract: 本发明提供了基于mq端口和redis数据库的模型训练方法及系统,该方法包括以下步骤:将现有医疗数据的数据格式进行统一,并作为训练集;利用训练集对预测模型进行训练;利用预测模型输出预测结果,将预测结果和审核结果存储于数据库并进行对比;若预测结果进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中;将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零。本发明将预测模型的输出结果进行存储以及发送人工审核,同时利用审核结果以及预测结果的对比,生成新的训练集,并对原预测模型进行重新训练。

    基于深度卷积网络控制门模型的用药推荐方法及系统

    公开(公告)号:CN116913459B

    公开(公告)日:2023-12-15

    申请号:CN202311171207.0

    申请日:2023-09-12

    Abstract: 本发明提供了基于深度卷积网络控制门模型的用药推荐方法及系统,该方法包括以下步骤:S1:获取现有的患者诊疗检查信息以及对应的最终用药数据;S2:根据患者诊疗检查信息与最终用药数据的对应关系,将每一条患者诊疗检查信息与最终用药数据进行数字ID映射的转化;S3:将转化为数字ID的患者诊疗信息作为输入,最终用药数据作为标签,输入控制门模型进行训练;S4:将实际患者诊疗信息输入控制门模型,输出建议用药概率。本发明通过深度卷积网络控制门模型学习已有的用户诊断检查数据,在训练完毕后,可以使用训练完毕的模型基于新的患者诊断检查检测指标对患者用药进行推荐,最终推荐出患者的最佳用药。

Patent Agency Ranking