基于知识图谱及聚类算法的医学相似实体分类方法及系统

    公开(公告)号:CN115080764B

    公开(公告)日:2022-11-01

    申请号:CN202210856458.1

    申请日:2022-07-21

    Abstract: 本发明涉及知识图谱技术领域,具体涉及基于知识图谱及聚类算法的医学相似实体分类方法及系统,本方法包括将医学数据库的数据构成三元组数据集,将三元组数据集作为训练集,对知识图谱学习模型进行训练,得到医学数据库的向量化表示的医学知识图谱,将其三元组通过均值池化层获得三元组的代表向量,利用无监督聚类算法Kmeans对实体和关系的代表向量进行聚类,得出医学知识图谱内的相似术语实体库,将同一簇内的实体作为正样本,将不同簇内的实体作为负样本,将正样本和负样本输入,训练实体相似分类模型,基于实体相似分类模型对实体进行相似判断;本发明解决人工标注相似实体分类繁琐的问题,实现对医学知识图谱无人工的准确构建。

    知识图谱构建过程中命名实体识别模型的训练方法和系统

    公开(公告)号:CN115048934A

    公开(公告)日:2022-09-13

    申请号:CN202210663574.1

    申请日:2022-06-13

    Abstract: 本申请公开了一种知识图谱构建过程中命名实体识别模型的训练方法和系统,包括:步骤S1、构建种子训练集;步骤S2、利用种子训练集对命名实体识别模型进行训练,更新命名实体识别模型;步骤S3、基于更新的命名实体识别模型对输入样本进行识别,生成样本识别结果;步骤S4、基于样本识别结果中的模糊命名实体更新种子训练集;步骤S5、重复步骤S2‑步骤S4,直至样本识别结果中无模糊命名实体,训练结束。本申请公开的知识图谱构建过程中命名实体识别模型的训练方法和系统,通过半监督学习的方法,提高了知识图谱构建过程中对命名实体的识别准确度,减少了人工工作量,降低了人工成本。

    一种医学标准映射模型的建立方法、系统及使用方法

    公开(公告)号:CN114996466A

    公开(公告)日:2022-09-02

    申请号:CN202210918247.6

    申请日:2022-08-01

    Abstract: 本发明涉及智慧医疗技术领域,且公开了一种医学标准映射模型的建立方法、系统及使用方法,本发明能够将医学实体数据按照原始词、标准词、标准词编码的类型进行准确的分类,并对分类后的训练数据进行预处理,从而得到统一化的实体数据集;利用统一化的实体数据集作为Bert模型的输入能够减少训练误差,且实体数据集是按照锚文本、正文本和负文本组成的三元组样本的形式进行划分,并能够提高特征向量获取的准确性,加强各文本的特征向量的联系性;同时,通过损失函数的计算和预设条件的设置,能够及时的停止Bert模型的训练,从而获取较准确的医学标准映射模型。

    一种基于早停判断和多头解码的问答处理方法

    公开(公告)号:CN119903920A

    公开(公告)日:2025-04-29

    申请号:CN202411985989.6

    申请日:2024-12-31

    Abstract: 本发明公开了一种基于早停判断和多头解码的问答处理方法,涉及大模型问答处理技术领域,方法包括:获取用户在人机交互平台上输入的问题数据,将所述问题数据输入至预设大模型中进行处理,得到所述问题数据对应的答案数据;所述预设大模型包含hidden层、self‑att层以及FeedFroward层,通过设定早停判断机制以及多头解码机制进行训练。本方案通过早停判断机制以及多头解码机制,优化解码以及推理阶段,减少计算量,提高训练效率,通过上述方式可以提升预设大模型的训练效率,同时能够因减少计算量而导致预设大模型的训练精度更高,得到更贴近用户的问题数据的答案数据。

    一种文本向量表示方法、装置、电子设备及存储介质

    公开(公告)号:CN119849441A

    公开(公告)日:2025-04-18

    申请号:CN202510045420.X

    申请日:2025-01-13

    Abstract: 本发明涉及一种文本向量表示方法、装置、电子设备及存储介质,该方法包括:获取待表示文本,并确定所述待表示文本对应的特征图;确定预设的滑动窗口在所述特征图上滑动时对应的多个窗口特征图;对于每个所述窗口特征图,对该窗口特征图进行混合池化操作,得到该窗口特征图对应的目标特征,直到得到所有窗口特征图对应的目标特征。通过本发明的方法,通过混合池化操作可综合局部特征捕捉的能力以及保留信息完整性方面的优势,从而可准确通过目标特征表达每个窗口特征图的特征,进而可提升待表示文本的向量表示的质量。

    一种医学知识图谱质量评估方法及系统

    公开(公告)号:CN118035678A

    公开(公告)日:2024-05-14

    申请号:CN202410142915.X

    申请日:2024-02-01

    Abstract: 本发明涉及一种医学知识图谱质量评估方法及系统;该方法通过用户在前端发起对目标定义型医学知识图谱进行检测的Api请求,该Api请求通过http接口形式返回至后端服务器,后端服务器在接收该Api请求后开始调用知识图谱检测系统进行检测,基于形式检测、概念异常检测和关系一致性检测,以便对目标定义型医学知识图谱的状态和不足之处进行筛选,生成相应的质量检测结果,后端服务器将生成的质量检测结果再次通过HTTP接口形式返回至前端,用于展示质量检测结果,以供用户查看,通过查看质量检测结果,用户能够对目标定义型医学知识图谱的状态和不足之处认识和了解,以便下一步的修正,从而提高了定义型医学知识图谱内知识的准确性和可靠性。

Patent Agency Ranking