-
公开(公告)号:CN116386800B
公开(公告)日:2023-08-18
申请号:CN202310658805.4
申请日:2023-06-06
Applicant: 神州医疗科技股份有限公司
IPC: G16H10/60 , G06F18/214 , G06F18/10 , G06F18/22 , G06F40/205 , G06F40/295
Abstract: 本发明公开了基于预训练语言模型的医疗病历数据分割方法和系统,通过预构建的预训练语言模型生成原始病历文本数据,基于N‑gram模型按照1~n gram对原始病历文本数据进行划分组合,得到病历划分数据,并通过预构建的bert模型得到病历词向量集合,再用预设的医疗领域所有的标准词通过bert模型得到标准词向量集合,通过相似度得分计算病历词与标准词的相似度得分,根据预设阈值将符合的病历词标识为疾病实体,从而实现病历文本的快速精确分割识别操作,解决了基于传统序列标注的分割方法中效率低且准确率不达标的问题。
-
公开(公告)号:CN115631868B
公开(公告)日:2023-04-21
申请号:CN202211461585.8
申请日:2022-11-17
Applicant: 神州医疗科技股份有限公司
Abstract: 本发明提供了一种基于提示学习模型的传染病预警直报方法和系统,涉及医疗信息化技术领域,包括如下步骤:获取不同医院的原始诊断疾病数据,提取所述原始诊断疾病数据中的诊断描述;基于所述诊断描述构建诊断描述的集合;获取不同传染病的规范名称,基于所述规范名称构建传染病名称集合;基于语言模型对诊断描述的集合中的每个诊断描述与传染病名称集合中的每个规范名称进行比对,判断是否匹配,当任一诊断描述与任一规范名称判断为匹配时上报预警。避免了碍于各个地区的医生的诊断业务能力不同,对传染病进行个性化的诊断描述或自定义的诊断描述,导致传染病不能够被及时发现,提高了识别传染病的准确度。
-
公开(公告)号:CN115545041B
公开(公告)日:2023-04-07
申请号:CN202211488054.8
申请日:2022-11-25
Applicant: 神州医疗科技股份有限公司
IPC: G06F40/30 , G06F40/211 , G06F40/242 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/0895
Abstract: 本发明涉及自然语言处理技术领域,且公开了一种增强医疗语句语义向量表示的模型构造方法,包括收集医学领域的医疗数据,并对所述医疗数据进行预处理,建构一份扩充医学词典;基于所述医疗数据进行预处理结果,保留Bert中的MLM任务,构建损失函数做全词掩码训练;保存训练后的Bert模型,切分所述医疗数据中的每段文本形成句子集合;基于句子集合,对每个句子进行对比学习训练;构建一个新的损失函数,判断当新的损失函数连续3次得出的数据不下降的情况下,得出最终Bert模型作为最终的增强语义向量表示的模型。本专利结合继续预训练和对比学习来有效增强医疗语句语义表示的构造方法,使医疗语句的表达更精确。
-
公开(公告)号:CN115062118B
公开(公告)日:2023-01-31
申请号:CN202210886767.3
申请日:2022-07-26
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本公开的实施例公开了双通道信息抽取方法、装置、电子设备和介质。涉及计算机技术领域。该方法的一具体实施方式包括:获取输入文本;生成上述输入文本的文本向量;基于上述文本向量,抽取上述输入文本的语义信息;将上述语义信息传输至具有显示功能的目标设备。该实施方式利用生成输入文本的文本向量的方式来抽取语义信息,实现了针对输入文本的语义信息的有效抽取。
-
公开(公告)号:CN114969386B
公开(公告)日:2022-11-18
申请号:CN202210926041.8
申请日:2022-08-03
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/36 , G06N3/04 , G06F16/31 , G06F40/289 , G06F40/295 , G16H50/20
Abstract: 本公开的实施例公开了应用于医学领域的消歧方法、装置、电子设备和介质,涉及医疗知识图谱构建技术领域。该方法的一具体实施方式包括:获取医学知识图谱和待消歧数据;基于上述医学知识图谱,对上述待消歧数据进行消歧处理,得到新的医学知识图谱;将上述新的医学知识图谱存储至目标医学信息平台的数据库。该实施方式实现了对待消歧数据的有效消歧,为医学知识图谱的更新、构建提供了重要帮助。
-
公开(公告)号:CN114996472A
公开(公告)日:2022-09-02
申请号:CN202210581933.9
申请日:2022-05-26
Applicant: 神州医疗科技股份有限公司
Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。
-
公开(公告)号:CN120012886A
公开(公告)日:2025-05-16
申请号:CN202510023356.5
申请日:2025-01-07
Applicant: 神州医疗科技股份有限公司
IPC: G06N5/022 , G06F18/213 , G06F18/25 , G06N3/045 , G06N3/0464
Abstract: 本发明涉及知识图谱技术领域,具体涉及一种基于临近节点路径检索的图谱补全方法及系统;本发明通过以构建的知识图谱,确定节点的存在关系的节点集合,形成正样本和负样本对节点路径数预测模型进行训练,通过节点关系预测模型计算知识图谱中某节点与其他任意节点的关系概率值,将计算的关系概率值的最大值所对应的节点作为该某节点的关系节点,并得出其关系路径数,对知识图谱进行补全。
-
公开(公告)号:CN114996472B
公开(公告)日:2025-04-25
申请号:CN202210581933.9
申请日:2022-05-26
Applicant: 神州医疗科技股份有限公司
IPC: G06F16/36 , G06F18/214 , G16H10/60
Abstract: 从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。
-
公开(公告)号:CN119762874A
公开(公告)日:2025-04-04
申请号:CN202411923656.0
申请日:2024-12-25
Applicant: 神州医疗科技股份有限公司
IPC: G06V10/764 , G06V10/82 , G06N3/044 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了一种基于大模型的输入提示优化方法、系统、设备及介质,涉及大模型优化训练技术领域,方法包括:获取训练预设大模型的原始输入提示集,并基于预训练模型对所述原始输入提示集进行处理得到优化后的原始输入提示集;所述预设大模型用于对待识别的机械图片进行处理得到所述待识别的机械图片对应的机械类型以及标识信息。本发明通过对原始输入提示集进行优化处理可以提升后续任一大模型的训练的精确度,此外,本方案通过预训练模型对原始输入提示集进行统一处理也能够提升处理效率。另外,预训练模型可以有针对性的为了优化出满足后续需求的输出结果,基于此可以灵活的调整对于预训练模型的训练方式或精度,使得本方案更具灵活性。
-
公开(公告)号:CN119761377A
公开(公告)日:2025-04-04
申请号:CN202411868956.3
申请日:2024-12-18
Applicant: 神州医疗科技股份有限公司
IPC: G06F40/30 , G06N3/08 , G06F18/214 , G06F18/22 , G06F40/211 , G06N3/045
Abstract: 本发明公开了一种大模型检索增强生成中关于文档切分效果评估的方法,涉及文档切分技术领域,方法包括:获取待评估文档的进行切分处理后得到的切分对,按照顺序将切分对输入至通用语义模型中,得到每个切分对对应的目标评价值,基于评价值与效果等级对应关系,确定所有目标评价值对应的目标效果等级;通用语义模型的训练过程具体为:对训练文档进行切分得到至少两个原始切块;对任一原始切块进行随机切分,得到预设个数的切片;按照语义是否存在相关性进行标注,得到n组训练样本;计算任一组训练样本对应的目标相关性分数以及目标分离性分数,确定该训练样本对应的评价值。本发明可以反馈每个文档对应的分割效果的评分也可以有助于辅助文档切分。
-
-
-
-
-
-
-
-
-