一种主题文本的生成方法及相关装置

    公开(公告)号:CN119398037A

    公开(公告)日:2025-02-07

    申请号:CN202411990611.5

    申请日:2024-12-31

    Abstract: 本申请公开了一种主题文本的生成方法及相关装置,涉及计算机技术领域,包括:获取待进行文本转换的目标合作主题向量,利用预训练的文本生成模型中的迁移微调层将目标合作主题向量处理为目标映射空间下的目标多角度特征向量,利用文本生成模型中的基座大语言模型将目标多角度特征向量处理为目标合作主题向量对应的主题文本。本申请基于训练数据同时训练迁移微调层的参数以及预设层的参数,通过预训练基座大语言模型中预设层的大量参数,可以确保目标合作主题向量转换为目标映射空间下的目标多角度特征向量后,该目标多角度特征向量可以被基座大语言模型准确地理解并解码,提高了最终生成的主题文本的可读性和准确性。

    一种基于知识图谱的机构名称规范方法和相关设备

    公开(公告)号:CN118070788B

    公开(公告)日:2024-11-22

    申请号:CN202410253730.6

    申请日:2024-03-06

    Abstract: 本申请公开一种基于知识图谱的机构名称规范方法和相关设备,其中方法包括:获取待处理的至少包括非标准机构名称的文献题录信息;构建至少包含缺失头实体的第一三元组的模型输入信息,第一三元组中的尾实体、缺失的头实体及关系,分别为非标准机构名称和对应的待预测标准机构名称及两者之间的关系;将模型输入信息输入第一、第二预测模型,以由两模型进行标准机构名称预测;根据两模型的预测结果,确定非标准机构名称对应的标准机构名称;两模型分别使用不同的知识图谱表示学习算法得到实体和关系的向量表示,基于学习的向量表示进行标准机构名称预测。本申请通过采用知识图谱表示学习方法进行机构名称规范,有效提升了机构名称规范处理的准确率。

    一种基于知识图谱的机构名称规范方法和相关设备

    公开(公告)号:CN118070788A

    公开(公告)日:2024-05-24

    申请号:CN202410253730.6

    申请日:2024-03-06

    Abstract: 本申请公开一种基于知识图谱的机构名称规范方法和相关设备,其中方法包括:获取待处理的至少包括非标准机构名称的文献题录信息;构建至少包含缺失头实体的第一三元组的模型输入信息,第一三元组中的尾实体、缺失的头实体及关系,分别为非标准机构名称和对应的待预测标准机构名称及两者之间的关系;将模型输入信息输入第一、第二预测模型,以由两模型进行标准机构名称预测;根据两模型的预测结果,确定非标准机构名称对应的标准机构名称;两模型分别使用不同的知识图谱表示学习算法得到实体和关系的向量表示,基于学习的向量表示进行标准机构名称预测。本申请通过采用知识图谱表示学习方法进行机构名称规范,有效提升了机构名称规范处理的准确率。

    一种科研机构信息处理方法及装置

    公开(公告)号:CN114328937A

    公开(公告)日:2022-04-12

    申请号:CN202210227794.X

    申请日:2022-03-10

    Abstract: 本申请提供了一种科研机构信息处理方法及装置,从开放资源中获取机构属性信息;将机构属性信息分成多种属性类型存储;获取机构名称信息,包括从开放资源中提取机构名称和从文献题录中获取机构全称;确定机构名称信息对应的机构类别;按机构类别,对机构名称信息进行聚类;按照属性类型,提取聚类结果对应的机构属性信息。本申请实现了文献题录中机构名称与开放资源中机构属性信息的映射,改善了机构名称的规范质量,链接了国内外开放资源,提高了科研机构名称规范库的整体价值。

    一种应用于医学知识图谱的数据融合方法及装置

    公开(公告)号:CN113535986A

    公开(公告)日:2021-10-22

    申请号:CN202111026237.3

    申请日:2021-09-02

    Abstract: 本发明公开了一种应用于医学知识图谱的数据融合方法及装置,包括:获取不同数据来源的初始三元组,所述三元组包括头实体、尾实体和关系;计算所述初始三元组中各个尾实体的相似度;基于所述各个尾实体的相似度计算结果,对各个尾实体进行融合;利用融合后的数据计算各个头实体的相似度;基于头实体的相似度计算结果,对头实体进行融合,得到目标三元组。本发明通过尾实体和头实体的分步计算实现了全部数据的融合,保证了知识图谱中数据的准确性。

    微服务应用平台及其资源保存方法和保存装置

    公开(公告)号:CN111008177A

    公开(公告)日:2020-04-14

    申请号:CN201911221188.1

    申请日:2019-12-03

    Abstract: 本发明提供了一种微服务应用平台,该微服务应用平台用于长期保存系统,该平台包括:微服务组件,微服务组件包括应用微服务组件、集成微服务组件和数据微服务组件;其中,应用微服务组件,用于提供功能级和插件级的微服务;集成微服务组件,用于提供集成功能的微服务;数据微服务组件,用于提供资源索引和资源存储的微服务;微服务管理组件,用于基于Docker技术容器化剥离微服务组件,并支持微服务组件间的快速解耦和融合。本发明综合利用微服务和Docker技术,微服务的高解耦性架构为长期保存系统所需的灵活扩展提供了良好的支持,从而实现对保存资源的快速访问和利用。

    一种主题文本的生成方法及相关装置

    公开(公告)号:CN119398037B

    公开(公告)日:2025-04-15

    申请号:CN202411990611.5

    申请日:2024-12-31

    Abstract: 本申请公开了一种主题文本的生成方法及相关装置,涉及计算机技术领域,包括:获取待进行文本转换的目标合作主题向量,利用预训练的文本生成模型中的迁移微调层将目标合作主题向量处理为目标映射空间下的目标多角度特征向量,利用文本生成模型中的基座大语言模型将目标多角度特征向量处理为目标合作主题向量对应的主题文本。本申请基于训练数据同时训练迁移微调层的参数以及预设层的参数,通过预训练基座大语言模型中预设层的大量参数,可以确保目标合作主题向量转换为目标映射空间下的目标多角度特征向量后,该目标多角度特征向量可以被基座大语言模型准确地理解并解码,提高了最终生成的主题文本的可读性和准确性。

    一种应用于医学知识图谱的数据融合方法及装置

    公开(公告)号:CN113535986B

    公开(公告)日:2023-05-05

    申请号:CN202111026237.3

    申请日:2021-09-02

    Abstract: 本发明公开了一种应用于医学知识图谱的数据融合方法及装置,包括:获取不同数据来源的初始三元组,所述三元组包括头实体、尾实体和关系;计算所述初始三元组中各个尾实体的相似度;基于所述各个尾实体的相似度计算结果,对各个尾实体进行融合;利用融合后的数据计算各个头实体的相似度;基于头实体的相似度计算结果,对头实体进行融合,得到目标三元组。本发明通过尾实体和头实体的分步计算实现了全部数据的融合,保证了知识图谱中数据的准确性。

    一种医学大数据长期保存系统

    公开(公告)号:CN111048164A

    公开(公告)日:2020-04-21

    申请号:CN201911166191.8

    申请日:2019-11-25

    Abstract: 本发明提供的医学大数据长期保存系统,在该系统中基础设施层分配运行资源;采集接收层采集接收多源异构医学数据,对多源异构医学数据进行分类处理得到待保存的医学大数据,并将待保存的医学大数据摄入至数据存储层;数据存储层利用保存元数据技术,对待保存的医学大数据进行封装得到规范化的长期保存的存档信息包,并对存档信息包进行监控、管理和维护;数据应用层提供功能级微服务和插件级微服务;数据服务层,用于通过数据访问与交互的接口提供数据分发服务,数据分发服务包括数据检索、浏览和下载。保证医学数据的真实性、完整性、可获得性以及长期可解释性,为重要医学资源的长期保存和利用提供有力保障。

    一种电子病历的标注方法及装置

    公开(公告)号:CN110010217A

    公开(公告)日:2019-07-12

    申请号:CN201910289691.4

    申请日:2019-04-11

    Abstract: 本申请提供了一种电子病历的标注方法及装置,获取人工标注病历数据集和未标注病历数据集;利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。本发明综合利用自然语言处理技术和机器学习方法对电子病历进行自动化标注,提高了电子病历的标注效率。

Patent Agency Ranking