-
公开(公告)号:CN116894436B
公开(公告)日:2023-12-15
申请号:CN202311143040.7
申请日:2023-09-06
Applicant: 神州医疗科技股份有限公司
IPC: G06F40/295 , G06F40/279 , G16H20/00 , G16H50/20 , G06N3/045
Abstract: 本发明公开了基于医学命名实体识别的数据增强方法及系统,本方案将标注好的医学文本数据进入bert模型后得到文本的向量表示,通过变分自编码算法(VAE),生成和原始文本相似的新的向量。为了保持原有的标注位置及标注信息,将生成的新向量与实体的起始、结束位置以及实体的长度向量进行叠加,最后送入模型进行训练,通过生成算法生成相似的向量,从而达到数据增强的效果,提升各类训练模型的泛化性能,进一步提高康复医学诊断、方案制定或者辅助治疗的效率。
-
公开(公告)号:CN116913459A
公开(公告)日:2023-10-20
申请号:CN202311171207.0
申请日:2023-09-12
Applicant: 神州医疗科技股份有限公司
IPC: G16H20/10 , G16H50/20 , G06F18/214 , G06F18/24 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了基于深度卷积网络控制门模型的用药推荐方法及系统,该方法包括以下步骤:S1:获取现有的患者诊疗检查信息以及对应的最终用药数据;S2:根据患者诊疗检查信息与最终用药数据的对应关系,将每一条患者诊疗检查信息与最终用药数据进行数字ID映射的转化;S3:将转化为数字ID的患者诊疗信息作为输入,最终用药数据作为标签,输入控制门模型进行训练;S4:将实际患者诊疗信息输入控制门模型,输出建议用药概率。本发明通过深度卷积网络控制门模型学习已有的用户诊断检查数据,在训练完毕后,可以使用训练完毕的模型基于新的患者诊断检查检测指标对患者用药进行推荐,最终推荐出患者的最佳用药。
-
公开(公告)号:CN116386800B
公开(公告)日:2023-08-18
申请号:CN202310658805.4
申请日:2023-06-06
Applicant: 神州医疗科技股份有限公司
IPC: G16H10/60 , G06F18/214 , G06F18/10 , G06F18/22 , G06F40/205 , G06F40/295
Abstract: 本发明公开了基于预训练语言模型的医疗病历数据分割方法和系统,通过预构建的预训练语言模型生成原始病历文本数据,基于N‑gram模型按照1~n gram对原始病历文本数据进行划分组合,得到病历划分数据,并通过预构建的bert模型得到病历词向量集合,再用预设的医疗领域所有的标准词通过bert模型得到标准词向量集合,通过相似度得分计算病历词与标准词的相似度得分,根据预设阈值将符合的病历词标识为疾病实体,从而实现病历文本的快速精确分割识别操作,解决了基于传统序列标注的分割方法中效率低且准确率不达标的问题。
-
公开(公告)号:CN115631868B
公开(公告)日:2023-04-21
申请号:CN202211461585.8
申请日:2022-11-17
Applicant: 神州医疗科技股份有限公司
Abstract: 本发明提供了一种基于提示学习模型的传染病预警直报方法和系统,涉及医疗信息化技术领域,包括如下步骤:获取不同医院的原始诊断疾病数据,提取所述原始诊断疾病数据中的诊断描述;基于所述诊断描述构建诊断描述的集合;获取不同传染病的规范名称,基于所述规范名称构建传染病名称集合;基于语言模型对诊断描述的集合中的每个诊断描述与传染病名称集合中的每个规范名称进行比对,判断是否匹配,当任一诊断描述与任一规范名称判断为匹配时上报预警。避免了碍于各个地区的医生的诊断业务能力不同,对传染病进行个性化的诊断描述或自定义的诊断描述,导致传染病不能够被及时发现,提高了识别传染病的准确度。
-
公开(公告)号:CN115545041B
公开(公告)日:2023-04-07
申请号:CN202211488054.8
申请日:2022-11-25
Applicant: 神州医疗科技股份有限公司
IPC: G06F40/30 , G06F40/211 , G06F40/242 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/0895
Abstract: 本发明涉及自然语言处理技术领域,且公开了一种增强医疗语句语义向量表示的模型构造方法,包括收集医学领域的医疗数据,并对所述医疗数据进行预处理,建构一份扩充医学词典;基于所述医疗数据进行预处理结果,保留Bert中的MLM任务,构建损失函数做全词掩码训练;保存训练后的Bert模型,切分所述医疗数据中的每段文本形成句子集合;基于句子集合,对每个句子进行对比学习训练;构建一个新的损失函数,判断当新的损失函数连续3次得出的数据不下降的情况下,得出最终Bert模型作为最终的增强语义向量表示的模型。本专利结合继续预训练和对比学习来有效增强医疗语句语义表示的构造方法,使医疗语句的表达更精确。
-
公开(公告)号:CN115062118B
公开(公告)日:2023-01-31
申请号:CN202210886767.3
申请日:2022-07-26
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本公开的实施例公开了双通道信息抽取方法、装置、电子设备和介质。涉及计算机技术领域。该方法的一具体实施方式包括:获取输入文本;生成上述输入文本的文本向量;基于上述文本向量,抽取上述输入文本的语义信息;将上述语义信息传输至具有显示功能的目标设备。该实施方式利用生成输入文本的文本向量的方式来抽取语义信息,实现了针对输入文本的语义信息的有效抽取。
-
公开(公告)号:CN114969386B
公开(公告)日:2022-11-18
申请号:CN202210926041.8
申请日:2022-08-03
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/36 , G06N3/04 , G06F16/31 , G06F40/289 , G06F40/295 , G16H50/20
Abstract: 本公开的实施例公开了应用于医学领域的消歧方法、装置、电子设备和介质,涉及医疗知识图谱构建技术领域。该方法的一具体实施方式包括:获取医学知识图谱和待消歧数据;基于上述医学知识图谱,对上述待消歧数据进行消歧处理,得到新的医学知识图谱;将上述新的医学知识图谱存储至目标医学信息平台的数据库。该实施方式实现了对待消歧数据的有效消歧,为医学知识图谱的更新、构建提供了重要帮助。
-
公开(公告)号:CN114996472A
公开(公告)日:2022-09-02
申请号:CN202210581933.9
申请日:2022-05-26
Applicant: 神州医疗科技股份有限公司
Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。
-
公开(公告)号:CN119903834A
公开(公告)日:2025-04-29
申请号:CN202411887946.4
申请日:2024-12-20
Applicant: 神州医疗科技股份有限公司
IPC: G06F40/258 , G06F18/22 , G06F16/38
Abstract: 本发明公开了一种大模型检索增强生成的自适应切片的文档切分方法,涉及大模型检索增强生成技术领域,方法包括:获取待切分文档,并对所述待切分文档按照标题类型进行切分,得到至少一组原始切块;根据任一原始切块对应的信息密度以及主题变化度,计算该原始切块的最优切分数量;根据所述最优切分数量对该原始切块进行切分处理。本发明先将文档按照层次标题进行切分,然后计算层次标题下的信息密度和主题变化度,以层级标题为单位,自动计算该层级标题下的最优切分大小,来指导文档的自适应切分,以提高后续检索和生成任务的效果。
-
公开(公告)号:CN119888401A
公开(公告)日:2025-04-25
申请号:CN202411912230.5
申请日:2024-12-24
Applicant: 神州医疗科技股份有限公司
IPC: G06V10/774 , G06N5/04 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了基于融合注意力与动态卷积的机械图片数据集生成方法,涉及大模型技术领域,方法包括:获取至少一张待识别机械图像,将所有待识别机械图像输入至大模型处理模块,生成每张待识别机械图像对应的机械类型以及标注信息;将所述机械类型、所述标注信息以及对应的待识别机械图像进行关联,生成一组数据信息,将所有组数据信息进行整合生成机械图片数据集;所述大模型处理模块包括多模态融合层、动态注意力机制层以及融合注意力与动态卷积的时空增强网络模块。本发明能够通过大模型处理模块可以自动从原始机械图像中提取、整理并标注出机械图片数据集,提高数据集生成的效率和准确性。
-
-
-
-
-
-
-
-
-