-
公开(公告)号:CN115758168A
公开(公告)日:2023-03-07
申请号:CN202211415096.9
申请日:2022-11-11
Applicant: 安徽讯飞医疗股份有限公司 , 安徽讯飞医疗股份有限公司武汉分公司
IPC: G06F18/22 , G06F18/214 , G06F40/295 , G06F40/30
Abstract: 本发明提供一种术语的标准化方法、装置、设备以及计算机可读介质,该方法通过获取原术语,将原术语输入至目标语言表征模型中,由目标语言表征模型得到并输出原术语的词向量;目标语言表征模型通过多个术语三元组对初始语言表征模型进行对比学习训练后得到;术语三元组包括:术语样本、正样本以及负样本,根据原术语的词向量和标准术语的词向量,计算得到原术语和标准术语之间的相似度,然后将与原术语之间的相似度最高的标准术语,确定为与原术语相匹配的标准术语。由于目标语言表征模型通过多个术语三元组对比学习得到,提高了匹配标准术语的准确度,避免了将与原术语的文本重合程度高、但实际却不相匹配的标准术语确定为相匹配的标准术语。
-
公开(公告)号:CN116011439A
公开(公告)日:2023-04-25
申请号:CN202211315947.2
申请日:2022-10-25
Applicant: 讯飞医疗科技股份有限公司 , 安徽讯飞医疗股份有限公司武汉分公司
IPC: G06F40/279 , G06F16/215 , G06F16/25 , G16H10/60
Abstract: 本申请公开了一种算法引擎的优化方法、装置、设备和存储介质,该方法包括:获取第一算法引擎数据;其中,第一算法引擎数据包括第一算法引擎包,第一算法引擎包为已利用测试集完成测试的算法引擎包;响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包。通过上述方式,本申请能够提升对算法引擎的优化效率。
-
公开(公告)号:CN112635050B
公开(公告)日:2022-12-06
申请号:CN202011556207.9
申请日:2020-12-23
Applicant: 安徽讯飞医疗股份有限公司
IPC: G16H50/20 , G16H50/70 , G06F40/284 , G06F40/30
Abstract: 本申请公开了一种诊断推荐方法及电子设备、存储装置,其中,诊断推荐方法包括:获取病历文本以及若干诊断文本的规则库;其中,规则库包含诊断文本的若干规则文本;提取病历文本的病历语义表示,并分别提取规则库中若干规则文本的规则语义表示;利用病历语义表示和若干规则文本的规则语义表示,得到病历文本与诊断文本之间的相关度;基于相关度,确定与病历文本匹配的诊断文本。上述方案,能够提升诊断推荐的泛化能力和准确率。
-
公开(公告)号:CN115293163A
公开(公告)日:2022-11-04
申请号:CN202210910491.8
申请日:2022-07-29
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F40/295 , G06F40/284 , G06F40/30
Abstract: 本申请公开了一种画像方法、装置、设备和存储介质,该方法包括:获取关于目标对象的若干原始医学文本;从若干原始医学文本中抽取多个文本信息,多个文本信息属于至少两个画像标签,至少两个画像标签所属类别包括目标对象基本信息、病情信息和治疗信息中的至少两类;将多个文本信息对应填充至至少两个画像标签,得到目标对象的画像信息。通过上述方式,本申请能够快速而又全面的了解目标对象信息,提高医务人员的工作效率。
-
公开(公告)号:CN114780691A
公开(公告)日:2022-07-22
申请号:CN202210701343.5
申请日:2022-06-21
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F16/33 , G06F40/295 , G06F40/30 , G06F16/332 , G06F16/35 , G06F16/36
Abstract: 本申请公开了一种模型预训练及自然语言处理方法、装置、设备及存储介质,本申请在预训练模型过程中,获取到训练文本及所属领域的知识图谱,基于知识图谱查找训练文本中匹配的目标实体词,以及训练文本所匹配的三元组,将训练文本中目标实体词进行掩码,得到掩码后训练文本,同时,选取一目标实体词,将其中头实体词和关系词与训练文本拼接,得到拼接后训练文本,进而以预测掩码后训练文本中被掩码的目标实体词,及预测拼接后训练文本包含的目标三元组中的尾实体词为目标,训练神经网络模型,得到预训练模型。由此可见,本申请将训练文本所属领域的知识图谱中的知识融入到模型预训练过程中,促进了模型对相关领域知识的理解和掌握。
-
-
公开(公告)号:CN114780691B
公开(公告)日:2022-12-02
申请号:CN202210701343.5
申请日:2022-06-21
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F16/33 , G06F40/295 , G06F40/30 , G06F16/332 , G06F16/35 , G06F16/36
Abstract: 本申请公开了一种模型预训练及自然语言处理方法、装置、设备及存储介质,本申请在预训练模型过程中,获取到训练文本及所属领域的知识图谱,基于知识图谱查找训练文本中匹配的目标实体词,以及训练文本所匹配的三元组,将训练文本中目标实体词进行掩码,得到掩码后训练文本,同时,选取一目标实体词,将其中头实体词和关系词与训练文本拼接,得到拼接后训练文本,进而以预测掩码后训练文本中被掩码的目标实体词,及预测拼接后训练文本包含的目标三元组中的尾实体词为目标,训练神经网络模型,得到预训练模型。由此可见,本申请将训练文本所属领域的知识图谱中的知识融入到模型预训练过程中,促进了模型对相关领域知识的理解和掌握。
-
公开(公告)号:CN115730566A
公开(公告)日:2023-03-03
申请号:CN202211481858.5
申请日:2022-11-24
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F40/126 , G06F40/295 , G06F16/35 , G16H10/60 , G06F18/214
Abstract: 本申请实施例公开了一种医学知识提取方法、装置、存储介质及计算机设备。该方法包括:获取输入的医学文本并进行编码处理,得到医学文本中每个字的编码特征,对于医学文本中任意长度的每个子文本,通过注意力机制和每个子文本的编码特征确定每个子文本的自身特征表示,以提高每个子文本的自身特征表示的准确性,根据每个子文本的自身特征表示,确定每个子文本所属的目标实体,得到医学文本中的子文本所属的目标实体所构成的实体集合后,对于实体集合中的任意两个子文本,根据两个子文本的自身特征表示,通过多视角的上下文注意力机制,确定两个子文本所属的目标实体之间的目标关系,提高实体之间的关系确定的准确性,提高医学知识获取的准确性。
-
公开(公告)号:CN115438652A
公开(公告)日:2022-12-06
申请号:CN202211170513.8
申请日:2022-09-23
Applicant: 安徽讯飞医疗股份有限公司
IPC: G06F40/247 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种医学术语质量监控方法及相关装置、电子设备、存储介质,其中,医学术语质量监控方法包括:获取初始术语库;再基于术语元素模板对医学术语对中标准术语和同义术语分别进行术语拆分,并对拆分词语进行标准化,得到医学术语对的拆分标准化结果;拆分标准化结果包括标准术语的第一拆分标准化组合和同义术语的第二拆分标准化组合,拆分标准化组合包括术语对照术语元素模板拆分后与各个术语元素分别对应的拆分词语经标准化后的标准词语;并基于初始术语库中各对医学术语对的拆分标准化结果对初始术语库进行质检,得到目标术语库。上述方案,能够尽可能地提升术语质检的效率,进而提高术语资源质量。
-
-
-
-
-
-
-
-