基于人类反馈与强化学习的问答回复方法、系统及设备

    公开(公告)号:CN116955576A

    公开(公告)日:2023-10-27

    申请号:CN202311218911.7

    申请日:2023-09-21

    Abstract: 本发明涉及语言处理技术领域,特别提供一种基于人类反馈与强化学习的问答回复方法、系统及设备,该方法包括:基于目标数据,构造数据集,并基于数据集,对预训练模型进行继续预训练,得到初始问答模型;基于目标数据,构造三元组指令集数据;利用三元组指令集数据对初始问答模型进行优化,得到问答模型;基于目标数据,构造人类偏好指令集数据;基于人类偏好指令集数据,对问答模型进行训练,得到奖励模型;利用人类反馈强化学习机制,对奖励模型进行强化,得到问答回复模型,从而实现具备专业度较高的问答能力,以及具有回复人性化且专业准确性更高的特点。

    基于医学命名实体识别的数据增强方法及系统

    公开(公告)号:CN116894436A

    公开(公告)日:2023-10-17

    申请号:CN202311143040.7

    申请日:2023-09-06

    Abstract: 本发明公开了基于医学命名实体识别的数据增强方法及系统,本方案将标注好的医学文本数据进入bert模型后得到文本的向量表示,通过变分自编码算法(VAE),生成和原始文本相似的新的向量。为了保持原有的标注位置及标注信息,将生成的新向量与实体的起始、结束位置以及实体的长度向量进行叠加,最后送入模型进行训练,通过生成算法生成相似的向量,从而达到数据增强的效果,提升各类训练模型的泛化性能,进一步提高康复医学诊断、方案制定或者辅助治疗的效率。

    一种加快医学关系抽取的方法和装置

    公开(公告)号:CN116401381B

    公开(公告)日:2023-08-04

    申请号:CN202310670289.7

    申请日:2023-06-07

    Abstract: 本发明公开了一种加快医学关系抽取的方法和装置,对于pipeline的关系抽取方法,在实体预测抽取前,通过排序以及合并规则机制对待预测文本进行长度和数量处理,调整待预测文本的长度并精简预测批次,经过bert模型时,减少多头自注意力机制层花费的时间,提升预测效率和关系抽取效率;在医学关系抽取前,对构建实体对时的实体进行判断,对于相同的实体类型不进行特征构建,对于不同的实体类型进行分析,从而去掉相同类型的实体对和不应该是头实体的实体对,对构建的实体对进行轻量化处理,提升预测效率和关系抽取效率。

    基于自训练文本纠错和文本匹配的医学直报方法及系统

    公开(公告)号:CN116502629A

    公开(公告)日:2023-07-28

    申请号:CN202310735155.9

    申请日:2023-06-20

    Abstract: 本发明涉及疾病预警技术领域,具体为基于自训练文本纠错和文本匹配的医学直报方法及系统;本方法包括基于原始病历数据构造文本纠错模型的训练数据,得到缺字补充模型和错字纠错模型,将新输入数据通过模型进行文本纠错处理,将纠错处理过后的数据,使用bm25算法和jaccard算法计算与已有疾病标准名称知识库的相似度,选择相似度综合评分最大的已有疾病标准名称作为该新输入数据映射的标准疾病名称,与危险传染疾病数据库中的传染疾病名称进行直接匹配检索,若存在相应的数据,则判断当前疾病为危险传染病,将该疾病直接上报给机构,完成危险病直报;实现数据标准化,使得直报系统可以准确识别病症,克服系统不准确的问题。

    一种异步队列任务的报错处理方法及系统

    公开(公告)号:CN116501533A

    公开(公告)日:2023-07-28

    申请号:CN202310759103.5

    申请日:2023-06-26

    Abstract: 本发明提供了一种异步队列任务的报错处理方法及系统,该方法包括以下步骤:S1:将诊断文本进行分组预处理,并存入消息队列中;S2:从消息队列中逐组取出消息,并通过API接口压入第一数据库中;S3:异步任务开启,从第一数据库获取队列消息,解析后送入到抽取模型中执行关系抽取任务,若执行失败,则向第二数据库写入识别键值;S4:继续获取队列消息,并判断识别键值是否与当前消息的键对应,若对应,则当前消息跳过关系抽取任务;S5:重复S3‑S4步骤,直到消息处理完毕。本发明所提供的一种异步队列任务的报错处理方法及系统,通过获取异常任务的任务ID+时间戳作为唯一标识,从而判断后续任务是否可以直接跳过不处理,进而达到减少消息处理时间的目的。

    基于融合注意力与动态卷积的机械图片数据集生成方法

    公开(公告)号:CN119888401A

    公开(公告)日:2025-04-25

    申请号:CN202411912230.5

    申请日:2024-12-24

    Abstract: 本发明公开了基于融合注意力与动态卷积的机械图片数据集生成方法,涉及大模型技术领域,方法包括:获取至少一张待识别机械图像,将所有待识别机械图像输入至大模型处理模块,生成每张待识别机械图像对应的机械类型以及标注信息;将所述机械类型、所述标注信息以及对应的待识别机械图像进行关联,生成一组数据信息,将所有组数据信息进行整合生成机械图片数据集;所述大模型处理模块包括多模态融合层、动态注意力机制层以及融合注意力与动态卷积的时空增强网络模块。本发明能够通过大模型处理模块可以自动从原始机械图像中提取、整理并标注出机械图片数据集,提高数据集生成的效率和准确性。

    基于多模态学习的目标分类方法、装置、设备及介质

    公开(公告)号:CN119884817A

    公开(公告)日:2025-04-25

    申请号:CN202411912711.6

    申请日:2024-12-24

    Abstract: 本发明涉及基于多模态学习的目标分类方法、装置、设备及介质,该方法包括:将待处理数据输入至预训练的分类模型中,得到待处理数据对应的分类结果;分类模型包括输入层用于接收待处理数据,深度可分离卷积层用于对每种数据进行逐通道卷积,得到每种数据对应的第一特征图,对每种数据对应的第一特征图进行逐点卷积,得到每种数据对应的第二特征图,基于每种数据对应的第一特征图和第二特征图,得到每种数据对应的第三特征图;多尺度特征融合层用于对所有数据对应的第三特征图进行融合处理得到融合特征图;输出层用于根据融合特征图得到分类结果。通过本发明的方法,可减少计算量并保持精度,从而可使得基于分类模型得到的分类结果更加准确。

    基于计算特征网络的精准医学信息结论生成方法

    公开(公告)号:CN117763140A

    公开(公告)日:2024-03-26

    申请号:CN202410196621.5

    申请日:2024-02-22

    Abstract: 本发明涉及一种基于计算特征网络的精准医学信息结论生成方法,该方法包括:步骤S10、获取医学论文的文本信息;步骤S20、构建基于要部分和结论部分的训练集和验证集;步骤S30、将训练集输入计算网络中进行结论输出模型训练;步骤S40、在利用完成训练的结论输出模型进行结论输出得到输出结果后,基于用户对所述输出结果的修正,优化所述结论输出模型。本发明,能够更好的基于医学论文的摘要部分得到对应的结论,减少人工阅读的繁琐工序,帮助用户得到逻辑更严密、表达清晰、更直观的结论,有利于提高效率。

Patent Agency Ranking