一种文献推荐方法及相关设备
    1.
    发明公开

    公开(公告)号:CN119441469A

    公开(公告)日:2025-02-14

    申请号:CN202510043599.5

    申请日:2025-01-10

    Abstract: 本申请实施例提供了一种文献推荐方法及相关设备,应用于数据处理领域。利用M个大语言模型,对用户检索关键词和关注的文献题目进行P次处理,以剔除大语言模型幻觉造成的异常推荐关键词。文献检索平台通过K个能够精准反映用户感兴趣的推荐关键词,利用语义相似度计算,可以精准获取用户感兴趣的目标文献,并将目标文献推荐给用户来拓展用户视野,避免用户陷入“信息孤岛”。且相对于基于用户画像的推荐方法,不需要分析大量用户的文献检索和阅读行为数据,因此有助于为用户精准推荐文献,增强文献推荐的普适性。

    一种基于动态权重计算的GPU资源调度方法及系统

    公开(公告)号:CN119415245A

    公开(公告)日:2025-02-11

    申请号:CN202411388540.1

    申请日:2024-09-30

    Abstract: 本发明公开了一种基于动态权重计算的GPU资源调度方法及系统,涉及算法服务技术领域,包括:根据算法初始权重和分析任务设计的算法流程对算法进行预运行;获取算法算力资源数据,并对算法算力资源进行预评估;根据算法算力资源数据、预评估的算法算力资源以及算法任务解析,设置执行算法流程的优先级顺序和动态权重,计算算法算力资源并生成动态调度方案;对算法算力资源进行验证和调整;加载全量数据运行算法,执行算法流程,并监测算法流程的执行过程。本发明可有效解决在服务器、GPU有限的情况下,满足尽可能更多的用户执行分析任务,而不出现排队等待或因资源竞争导致任务失败的情况,确保算法平台高效稳定运行。

    一种主题文本的生成方法及相关装置

    公开(公告)号:CN119398037A

    公开(公告)日:2025-02-07

    申请号:CN202411990611.5

    申请日:2024-12-31

    Abstract: 本申请公开了一种主题文本的生成方法及相关装置,涉及计算机技术领域,包括:获取待进行文本转换的目标合作主题向量,利用预训练的文本生成模型中的迁移微调层将目标合作主题向量处理为目标映射空间下的目标多角度特征向量,利用文本生成模型中的基座大语言模型将目标多角度特征向量处理为目标合作主题向量对应的主题文本。本申请基于训练数据同时训练迁移微调层的参数以及预设层的参数,通过预训练基座大语言模型中预设层的大量参数,可以确保目标合作主题向量转换为目标映射空间下的目标多角度特征向量后,该目标多角度特征向量可以被基座大语言模型准确地理解并解码,提高了最终生成的主题文本的可读性和准确性。

    一种基于知识图谱的机构名称规范方法和相关设备

    公开(公告)号:CN118070788B

    公开(公告)日:2024-11-22

    申请号:CN202410253730.6

    申请日:2024-03-06

    Abstract: 本申请公开一种基于知识图谱的机构名称规范方法和相关设备,其中方法包括:获取待处理的至少包括非标准机构名称的文献题录信息;构建至少包含缺失头实体的第一三元组的模型输入信息,第一三元组中的尾实体、缺失的头实体及关系,分别为非标准机构名称和对应的待预测标准机构名称及两者之间的关系;将模型输入信息输入第一、第二预测模型,以由两模型进行标准机构名称预测;根据两模型的预测结果,确定非标准机构名称对应的标准机构名称;两模型分别使用不同的知识图谱表示学习算法得到实体和关系的向量表示,基于学习的向量表示进行标准机构名称预测。本申请通过采用知识图谱表示学习方法进行机构名称规范,有效提升了机构名称规范处理的准确率。

    一种基于医疗诊断模型的辅助诊断方法、装置、电子设备和存储介质

    公开(公告)号:CN118942682A

    公开(公告)日:2024-11-12

    申请号:CN202411175260.2

    申请日:2024-08-26

    Abstract: 本申请公开了一种基于医疗诊断模型的辅助诊断方法、装置、电子设备和存储介质,该方法和装置应用于电子设备,具体为获取电子病历;对电子病历进行特征提取处理,得到特征数据;基于医疗诊断模型对电子病历和特征数据进行处理,得到待诊断患者的辅助诊疗信息,医疗诊断模型包括改进Transformer疾病预测网络和通过对大型医疗模型进行有监督微调试处理得到的大型语言模型。本申请中的技术方案基于大语言模型的自然语言处理技术可以实现自动化数据清洗和标准化,能够识别和纠正不一致的数据,提高数据的完整性和准确性。从而能够避免后续得出的辅助诊断信息出错,也就能够帮助医生避免做出错误的诊断结果。

    一种生物医学数据集标准数据元的知识图谱构建方法及系统

    公开(公告)号:CN118394954B

    公开(公告)日:2024-10-22

    申请号:CN202410595015.0

    申请日:2024-05-14

    Abstract: 本发明公开了一种生物医学数据集标准数据元的知识图谱构建方法及系统,涉及医学数据处理技术领域,收集不同类型的生物医学数据集数据元的相关标准文本和生物医学数据集相关标准的数据;并进行分析和归纳;构建生物医学数据集标准数据元知识图谱的知识模型;从结构化数据和结构化数据中的非结构化文本抽取实体类型数据及属性数据;根据建立的实体类型之间的语义关联关系类型,进行多类数据的知识融合,得到生物医学数据集标准数据元知识图谱。本发明不仅增强领域数据集元数据和数据元、分类、值域标准的可用性和利用率,而且还实现数据元的统一和数据集创建的规范性以及提高机器可读性和语义互操作性。

    一种便携式文档格式文件的结构化解析方法及相关产品

    公开(公告)号:CN117473980B

    公开(公告)日:2024-07-05

    申请号:CN202311498326.7

    申请日:2023-11-10

    Abstract: 本申请提供了一种便携式文档格式文件的结构化解析方法及相关产品,可应用于数据处理技术领域,该方法包括:提取与便携式文档格式文件对应的元数据信息、内容信息以及页面尺寸信息;利用训练好的文件智能分析模型确定便携式文档格式文件的页面对应的预设图片格式文件的类型区域;基于页面尺寸信息、文本坐标以及图片坐标,利用训练好的文件智能分析模型将文本和图片与类型区域进行匹配,得到第一结构化数据;利用正则表达式和文本坐标,对参考文献和引用语句进行关联映射,得到第二结构化数据;对元数据信息和第二结构化数据进行关联并输出。如此,利用训练好的文件智能分析模型将文本和图片与类型区域进行匹配关联,从而提高了解析的准确性。

    基于层间比对的大语言模型训练和使用方法及相关装置

    公开(公告)号:CN117892139B

    公开(公告)日:2024-05-14

    申请号:CN202410293082.7

    申请日:2024-03-14

    Abstract: 本申请公开了基于层间比对的大语言模型训练和使用方法及相关装置,应用于人工智能领域。本申请的大语言模型包括N层网络模型以及与N层网络模型的输出端分别相连的解码策略模块。通过解码策略模块获取N层网络模型分别输出的第一概率分布。低层级的网络模型的输出错误率较高,高层级的网络模型的输出准确率较高。若第Q层与第N层的网络模型的第一概率分布差异最大,那么第N层的网络模型的输出的准确率比较高,第Q层的网络模型的输出的错误率比较高,本申请利用第N层和第Q层的网络模型的输出之间的差异,确定出第一目标token。大语言模型的输出降低了低层级的网络模型的幻觉认知,增加了高层级网络模型的事实性回答,提高了准确度。

    一种基于匿名化算法的数据共享隐私保护方法

    公开(公告)号:CN116894271B

    公开(公告)日:2024-04-26

    申请号:CN202310980143.2

    申请日:2023-08-04

    Abstract: 本发明公开了一种基于匿名化算法的数据共享隐私保护方法,涉及隐私保护技术领域,包括:识别和归并需要进行隐私保护的属性,明确匿名化处理对象;采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离每个第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,从而实现数据的匿名化。

Patent Agency Ranking