-
公开(公告)号:CN119398037B
公开(公告)日:2025-04-15
申请号:CN202411990611.5
申请日:2024-12-31
Applicant: 中国医学科学院医学信息研究所
IPC: G06F40/258 , G06F40/151 , G06F18/213 , G06F40/30 , G06F16/34
Abstract: 本申请公开了一种主题文本的生成方法及相关装置,涉及计算机技术领域,包括:获取待进行文本转换的目标合作主题向量,利用预训练的文本生成模型中的迁移微调层将目标合作主题向量处理为目标映射空间下的目标多角度特征向量,利用文本生成模型中的基座大语言模型将目标多角度特征向量处理为目标合作主题向量对应的主题文本。本申请基于训练数据同时训练迁移微调层的参数以及预设层的参数,通过预训练基座大语言模型中预设层的大量参数,可以确保目标合作主题向量转换为目标映射空间下的目标多角度特征向量后,该目标多角度特征向量可以被基座大语言模型准确地理解并解码,提高了最终生成的主题文本的可读性和准确性。
-
公开(公告)号:CN113535986B
公开(公告)日:2023-05-05
申请号:CN202111026237.3
申请日:2021-09-02
Applicant: 中国医学科学院医学信息研究所
IPC: G06F16/36 , G06F40/30 , G06F18/22 , G06F18/241 , G16H10/00
Abstract: 本发明公开了一种应用于医学知识图谱的数据融合方法及装置,包括:获取不同数据来源的初始三元组,所述三元组包括头实体、尾实体和关系;计算所述初始三元组中各个尾实体的相似度;基于所述各个尾实体的相似度计算结果,对各个尾实体进行融合;利用融合后的数据计算各个头实体的相似度;基于头实体的相似度计算结果,对头实体进行融合,得到目标三元组。本发明通过尾实体和头实体的分步计算实现了全部数据的融合,保证了知识图谱中数据的准确性。
-
公开(公告)号:CN111048164A
公开(公告)日:2020-04-21
申请号:CN201911166191.8
申请日:2019-11-25
Applicant: 中国医学科学院医学信息研究所
IPC: G16H10/00 , G06F16/951 , G06F16/901
Abstract: 本发明提供的医学大数据长期保存系统,在该系统中基础设施层分配运行资源;采集接收层采集接收多源异构医学数据,对多源异构医学数据进行分类处理得到待保存的医学大数据,并将待保存的医学大数据摄入至数据存储层;数据存储层利用保存元数据技术,对待保存的医学大数据进行封装得到规范化的长期保存的存档信息包,并对存档信息包进行监控、管理和维护;数据应用层提供功能级微服务和插件级微服务;数据服务层,用于通过数据访问与交互的接口提供数据分发服务,数据分发服务包括数据检索、浏览和下载。保证医学数据的真实性、完整性、可获得性以及长期可解释性,为重要医学资源的长期保存和利用提供有力保障。
-
公开(公告)号:CN110010217A
公开(公告)日:2019-07-12
申请号:CN201910289691.4
申请日:2019-04-11
Applicant: 中国医学科学院医学信息研究所
Abstract: 本申请提供了一种电子病历的标注方法及装置,获取人工标注病历数据集和未标注病历数据集;利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。本发明综合利用自然语言处理技术和机器学习方法对电子病历进行自动化标注,提高了电子病历的标注效率。
-
公开(公告)号:CN102136009A
公开(公告)日:2011-07-27
申请号:CN201110115817.X
申请日:2011-05-06
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明涉及一种基于本体和表达式的传染病文献标引方法,包括以下步骤:一、定义传染病领域本体,包括本体涉及的概念和概念之间的关系;二、采集传染病领域信息资源,并按照预先定义的结构存储到数据库中;三、使用本体的概念组成的表达式对数据库中的文献进行标引;四、检索时使用本体的概念组成的表达式构造检索式,对数据库中的文献进行检索。本发明基于传染病领域的数据特点和用户需求,提供了一种使用该领域的概念和关系构造本体,并使用表达式对信息资源进行知识标引的方法,能够有效地组织该领域的信息资源,并为用户提供更加精确和智能化的检索与分析服务。
-
公开(公告)号:CN119670700A
公开(公告)日:2025-03-21
申请号:CN202411830701.8
申请日:2024-12-12
Applicant: 中国医学科学院医学信息研究所
IPC: G06F40/16 , G06F40/157 , G06N3/0475 , G06N3/0455 , G06N3/042 , G06N3/0464
Abstract: 本申请公开了一种全称信息的生成方法及相关装置,涉及自然语言处理技术领域。本申请利用预先训练的序列生成模型,通过基于自注意力机制构建的编码器中的多层编码器块,逐层对基于对应的权重参数融合图嵌入向量后的中间向量进行编码,通过基于自注意力机制的构建的解码器中的多层解码器块逐层对基于权重参数融合图嵌入向量后的中间向量进行解码,得到由各个目标简称子词的全称嵌入向量构成的全称嵌入向量序列,依据全称嵌入向量序列生成目标简称信息的全称信息。本申请通过序列生成模型,基于图嵌入式强化学习,实现提高目标简称信息的全称信息的准确度的目的。
-
公开(公告)号:CN118966440A
公开(公告)日:2024-11-15
申请号:CN202411041665.7
申请日:2024-07-31
Applicant: 中国医学科学院医学信息研究所
IPC: G06Q10/04 , G06Q10/101 , G06N20/00
Abstract: 本发明提供一种基于序列推荐的合作关系预测方法、装置及电子设备,涉及数据预测领域。在进行合作关系预测时,通过时间嵌入描述作者对应的文本随时间的动态变化情况,通过作者高阶嵌入考虑作者与合作者的历史合作关系,通过内容嵌入表征文本核心描述情况,进而基于时间嵌入、内容嵌入、作者嵌入集合及Token嵌入,预测目标作者的合作者时,能够从多角度预测合作关系,提高预测准确度。另外,为作者配置多个Token,得到作者对应的多个Token嵌入,能够在模型训练时节省计算资源,也能够实现作者数量较大的场景下的合作关系预测,准确性、可靠性和效率较高。使用k‑best‑crf算法进行多Token分类预测,提高预测成功率。
-
公开(公告)号:CN118070788A
公开(公告)日:2024-05-24
申请号:CN202410253730.6
申请日:2024-03-06
Applicant: 中国医学科学院医学信息研究所
IPC: G06F40/279 , G06F40/216 , G06F16/36 , G06F16/28
Abstract: 本申请公开一种基于知识图谱的机构名称规范方法和相关设备,其中方法包括:获取待处理的至少包括非标准机构名称的文献题录信息;构建至少包含缺失头实体的第一三元组的模型输入信息,第一三元组中的尾实体、缺失的头实体及关系,分别为非标准机构名称和对应的待预测标准机构名称及两者之间的关系;将模型输入信息输入第一、第二预测模型,以由两模型进行标准机构名称预测;根据两模型的预测结果,确定非标准机构名称对应的标准机构名称;两模型分别使用不同的知识图谱表示学习算法得到实体和关系的向量表示,基于学习的向量表示进行标准机构名称预测。本申请通过采用知识图谱表示学习方法进行机构名称规范,有效提升了机构名称规范处理的准确率。
-
公开(公告)号:CN116842184A
公开(公告)日:2023-10-03
申请号:CN202211452095.1
申请日:2022-11-21
Applicant: 北京理工大学 , 中国医学科学院医学信息研究所
Abstract: 本发明涉及一种基于标签和内容分层融合的医学领域知识融合方法,属于知识融合和人工智能技术领域。对不同知识图谱的医学知识进行融合,构建医学领域知识库,提供规模化医学行业知识服务。该方法包含定义医学知识图谱中实体的元标签、数据标签对齐,以及标签内容融合三个步骤。该方法的特点是,其一,在数据标签对齐中,设计了一种基于字符串度量和语义度量集成的数据标签对齐方法,利用字符串特征和语义特征进行数据标签对齐。其二,在标签内容融合中,提出内容聚合校验与非结构化知识生成的联合机制,旨在提取不同知识图谱中不同粒度的共同知识、校验相悖知识,并将共同三元组知识重新转换为非结构化语句,构建医学知识库。
-
公开(公告)号:CN114328937A
公开(公告)日:2022-04-12
申请号:CN202210227794.X
申请日:2022-03-10
Applicant: 中国医学科学院医学信息研究所
IPC: G06F16/35 , G06F16/332 , G06F16/33 , G06K9/62
Abstract: 本申请提供了一种科研机构信息处理方法及装置,从开放资源中获取机构属性信息;将机构属性信息分成多种属性类型存储;获取机构名称信息,包括从开放资源中提取机构名称和从文献题录中获取机构全称;确定机构名称信息对应的机构类别;按机构类别,对机构名称信息进行聚类;按照属性类型,提取聚类结果对应的机构属性信息。本申请实现了文献题录中机构名称与开放资源中机构属性信息的映射,改善了机构名称的规范质量,链接了国内外开放资源,提高了科研机构名称规范库的整体价值。
-
-
-
-
-
-
-
-
-