一种医学标准映射模型的建立方法、系统及使用方法

    公开(公告)号:CN114996466B

    公开(公告)日:2022-11-01

    申请号:CN202210918247.6

    申请日:2022-08-01

    Abstract: 本发明涉及智慧医疗技术领域,且公开了一种医学标准映射模型的建立方法、系统及使用方法,本发明能够将医学实体数据按照原始词、标准词、标准词编码的类型进行准确的分类,并对分类后的训练数据进行预处理,从而得到统一化的实体数据集;利用统一化的实体数据集作为Bert模型的输入能够减少训练误差,且实体数据集是按照锚文本、正文本和负文本组成的三元组样本的形式进行划分,并能够提高特征向量获取的准确性,加强各文本的特征向量的联系性;同时,通过损失函数的计算和预设条件的设置,能够及时的停止Bert模型的训练,从而获取较准确的医学标准映射模型。

    基于知识图谱及聚类算法的医学相似实体分类方法及系统

    公开(公告)号:CN115080764A

    公开(公告)日:2022-09-20

    申请号:CN202210856458.1

    申请日:2022-07-21

    Abstract: 本发明涉及知识图谱技术领域,具体涉及基于知识图谱及聚类算法的医学相似实体分类方法及系统,本方法包括将医学数据库的数据构成三元组数据集,将三元组数据集作为训练集,对知识图谱学习模型进行训练,得到医学数据库的向量化表示的医学知识图谱,将其三元组通过均值池化层获得三元组的代表向量,利用无监督聚类算法Kmeans对实体和关系的代表向量进行聚类,得出医学知识图谱内的相似术语实体库,将同一簇内的实体作为正样本,将不同簇内的实体作为负样本,将正样本和负样本输入,训练实体相似分类模型,基于实体相似分类模型对实体进行相似判断;本发明解决人工标注相似实体分类繁琐的问题,实现对医学知识图谱无人工的准确构建。

    应用于医学领域的词语处理方法、装置、电子设备和介质

    公开(公告)号:CN115034225A

    公开(公告)日:2022-09-09

    申请号:CN202210654252.0

    申请日:2022-06-10

    Abstract: 本公开的实施例公开了应用于医学领域的词语处理方法、装置、电子设备和介质。该方法的一具体实施方式包括:获取待处理词语;生成待处理词语的词向量;基于词向量,生成待处理词语的语义向量;基于语义向量,确定语义向量对应的预测类别值;计算待处理词语与预设标准词语库中标准词语的相似度,得到相似度集合;基于预测类别值和相似度集合,从预设标准词语库中选择出目标标准词语。该实施方式通过生成待处理词语的词向量、语义向量,学习向量序列之间的语义关联,再根据确定的预测类别值和相似度集合,选择出待处理词语对应的目标标准词语。提高了医学词语标准化的效率和准确度,为医疗数据被应用提供了重要帮助。

    基于知识图谱的糖尿病风险预测方法、装置、设备及介质

    公开(公告)号:CN114999654A

    公开(公告)日:2022-09-02

    申请号:CN202210750831.5

    申请日:2022-06-28

    Abstract: 本申请提供了一种基于知识图谱的糖尿病风险预测方法、装置、设备及介质,其中,该方法包括:使用待预测对象的第一病历数据对糖尿病知识图谱进行更新得到目标知识图谱;根据目标知识图谱中待预测年份节点的周围节点的第一节点向量,确定待预测年份节点的第二节点向量;根据第二节点向量和目标节点与待预测年份节点之间的第一关联关系向量得到第一拼接向量;目标节点为患病节点和/或未患病节点;第一关联关系向量是根据待预测年份节点与周围节点之间的第二关联关系向量确定的;将第一拼接向量和目标节点向量输入到糖尿病风险预测模型中输出第一余弦相似度;根据第一余弦相似度确定糖尿病的患病概率。通过该方法提高了糖尿病风险预测的准确性。

    一种自动判断并融合知识图谱的关系抽取方法及系统

    公开(公告)号:CN114925212A

    公开(公告)日:2022-08-19

    申请号:CN202210485506.0

    申请日:2022-05-06

    Abstract: 本发明公开了一种自动判断并融合知识图谱的关系抽取方法及系统,在医学范围内预先建立了小范围的原始数据库,基于此原始数据库并结合医学知识图谱充分获取了待分类的实体的更多特征信息,如实体、句子、属性节点以及上下文信息,提高了模型可获得的信息量,提高关系分类任务的准确率,对不同类型的实体数据进行数据增强和调整超参数,进一步提高了关系分类抽取的准确率;将实体、句子、属性节点以及上下文信息等特征信息融合到关系抽取的任务中并结合注意力机制的计算方式对相关性属性节点进行了筛选,从而能根据节点的关键信息以及当前任务的重要程度做出筛选,考虑到不同语境下的节点所代表的含义,优化了目前构建医学术语集的准确性。

    一种乳腺钼靶图像分割的装置、电子设备、医疗设备和介质

    公开(公告)号:CN113393475A

    公开(公告)日:2021-09-14

    申请号:CN202110734983.1

    申请日:2021-06-30

    Abstract: 本申请实施例提供一种乳腺钼靶图像分割的装置、电子设备、医疗设备和介质,该电子设备包括存储器和处理器,所述存储器被配置为存储计算机程序,其中,所述处理器通过执行所述程序以实现如下乳腺钼靶图像分割的方法:获取乳腺钼靶图像;根据所述乳腺钼靶图像上非零像素的平均值确定目标分割线;根据所述目标分割线从所述乳腺钼靶图像上获取乳腺区域;基于所述乳腺区域进行数据分析,能够高效准确的从乳腺钼靶图像中获取乳腺区域,从而降低病灶检测过程中的噪音干扰(例如:在病灶检测过程中由胸大肌区域带来的噪音干扰),提升后续数据分析的准确率。

    一种大模型检索增强生成的自适应切片的文档切分方法

    公开(公告)号:CN119903834A

    公开(公告)日:2025-04-29

    申请号:CN202411887946.4

    申请日:2024-12-20

    Abstract: 本发明公开了一种大模型检索增强生成的自适应切片的文档切分方法,涉及大模型检索增强生成技术领域,方法包括:获取待切分文档,并对所述待切分文档按照标题类型进行切分,得到至少一组原始切块;根据任一原始切块对应的信息密度以及主题变化度,计算该原始切块的最优切分数量;根据所述最优切分数量对该原始切块进行切分处理。本发明先将文档按照层次标题进行切分,然后计算层次标题下的信息密度和主题变化度,以层级标题为单位,自动计算该层级标题下的最优切分大小,来指导文档的自适应切分,以提高后续检索和生成任务的效果。

Patent Agency Ranking