基于本地知识库与自然语言大模型的图查询方法与系统

    公开(公告)号:CN117009492B

    公开(公告)日:2024-01-09

    申请号:CN202311269299.6

    申请日:2023-09-28

    Abstract: 本申请涉及一种基于本地知识库与自然语言大模型的图查询方法与系统,其中,基于本地知识库与自然语言大模型的图查询方法包括:结合图数据库中获取的图谱结构与本地知识库文档,生成多个领域知识问题与图数据库查询命令的组合;将用户输入的问题转化为对应的向量,并确定与所述用户输入问题对应的向量相匹配的K个领域知识问题与图数据库查询命令的组合;将所述用户输入的问题与所述K个领域知识问题与图数据库查询命令的组合填充到预设的上下文提示模版,得到填充后的问题,并将填充后的问题输入至所述预训练自然语言大模型,生成最终的图数据库查询命令;使用所述最终的图数据库查询命令查询图数据库得到查询结果,提高了图查询结果的准确性。(56)对比文件徐健.基于知识图谱构建5G协议知识库.移动通信.2020,(第08期),全文.王仁武;袁毅;袁旭萍.基于深度学习与图数据库构建中文商业知识图谱的探索研究.图书与情报.2016,(第01期),全文.

    理赔事件检测方法、计算机设备和存储介质

    公开(公告)号:CN116150341B

    公开(公告)日:2023-07-18

    申请号:CN202310440660.0

    申请日:2023-04-23

    Abstract: 本申请涉及一种理赔事件检测方法、计算机设备和存储介质,在图网络发生变更的情况下,更新第一节点序列,得到当前时间戳的第二节点序列,其中,图网络基于理赔事件的数据构建得到,第一节点序列通过关联图网络中的多个节点得到;在词向量模型中,根据第二节点序列和涉变更节点的权重参数,对词向量模型进行反向迭代训练,并根据训练后的词向量模型得到当前时间戳的节点向量,其中,涉变更节点包括图网络中节点和/或节点之间的边发生变化的节点;根据当前时间戳的节点向量,确定理赔事件是否属于目标类型事件,如此设置,只需要迭代更新部分节点的权重参数,减少了计算量,从而能够准确且高效地检测理赔事件。

    基于自动特征挖掘的可解释信贷违约率预测方法、系统

    公开(公告)号:CN115936159A

    公开(公告)日:2023-04-07

    申请号:CN202211016771.0

    申请日:2022-08-24

    Abstract: 本发明公开了一种基于自动特征挖掘的可解释信贷违约率预测方法、系统,首先从客户信用资料库中提取每笔贷款的特征数据,并进行预处理;定义自动特征挖掘的操作算子集O和一种自动特征挖掘方法,并通过该操作算子集O得到自动特征集;构建违约率预测模型,并结合全局可解释方法和局部可解释方法,得到通过全局重要性特征排序、基于当前数据库搜索的反事实样本、基于特征扰动和生成模型的虚拟反事实样本,基于此给出可解释信贷违约率预测。本发明方法使得违约预测模型训练和更新无需专家经验干预,缓解专家经验差异大的问题,节省人力,能够满足审计需求,同时针对一线客户经理给出判断依据和相似判例参考。

    基于邻域节点结构编码的图神经网络异常检测方法与装置

    公开(公告)号:CN115859143A

    公开(公告)日:2023-03-28

    申请号:CN202211424557.9

    申请日:2022-11-14

    Abstract: 本发明公开了基于邻域节点结构编码的图神经网络异常检测方法与装置,包括:将原始数据转换为图神经网络的输入数据,输入数据包括节点属性矩阵、邻接矩阵;从邻接矩阵抽取出结构特征并进行矩阵分解,得到节点角色特征与角色结构特征因子;将节点角色特征与其转置矩阵相乘,得到高阶邻接矩阵;将节点属性矩阵与邻接矩阵、节点属性矩阵与高阶邻接矩阵分别输入图神经网络,得到节点角色语义潜变量和节点角色语义潜变量;并进行动态加权,得到最终节点表示,将其输入至激活函数,训练图神经网络,直至图神经网络收敛,将激活函数的输出向量中概率最高的标签作为分类结果即异常类别,异常类别对应的节点即为检测到的异常目标。

    基于专家统计特征的增量计算更新方法、电子设备、介质

    公开(公告)号:CN115438054A

    公开(公告)日:2022-12-06

    申请号:CN202211017850.3

    申请日:2022-08-24

    Abstract: 本发明公开了一种基于专家统计特征的增量计算更新方法、电子设备、介质,本发明方法分为离线计算和在线计算,其中离线计算首先读取专家统计特征的配置信息;然后抽取历史数据的统计特征的用户统计关联信息;最后持久化历史数据的统计关联信息。在线计算首先读取专家统计特征的配置信息;然后抽取新增数据的统计特征的用户统计关联信息;同时读取历史数据持久化的用户统计关联信息;接下来基于历史和新增数据抽取得到的统计关联信息生成更新后的离线数据统计关联信息并执行持久化操作;最后基于更新后的离线数据的统计关联信息生成对应的统计特征。本发明方法针对低服务器资源的情况,仍然能够高效的输出统计特征。

    基于实体词属性特征和回译的中文金融文本数据增强方法

    公开(公告)号:CN115048940A

    公开(公告)日:2022-09-13

    申请号:CN202210724689.7

    申请日:2022-06-23

    Abstract: 本发明公开了一种基于实体词属性特征和回译的中文金融文本数据增强方法。该方法包括:首先对输入的金融文本进行文本预处理工作;紧接着,通过命名实体识别和词汇匹配的方法对金融文本中翻译难度较大的实体词使用指代字符进行实体词指代替换以生成金融文本的中间文本和指代字符‑实体映射关系字典;之后,使用回译的方法增强金融文本的中间文本,并使用指代字符‑实体映射关系字典还原文本中的指代字符,进而生成与原文本语义相似的新文本。此外,本方法在中文金融文本的数据增强任务中,首次关注并分析了实体词属性特征对文本数据增强结果的影响,并将不同种类的实体词属性特征分层次处理,提高了数据增强后得到文本的质量。

    一种基于时空注意力机制的大语言模型预测方法及装置

    公开(公告)号:CN117786061B

    公开(公告)日:2024-06-04

    申请号:CN202311675342.9

    申请日:2023-12-06

    Abstract: 本说明书公开了一种基于时空注意力机制的大语言模型预测方法及装置,可以用于处理目标实体及部分关联实体的下游预测任务,包括:通过将目标实体及关联实体的初始特征和动态知识图谱输入到空间注意力网络中得到空间拓扑特征;将空间拓扑特征输入到时序注意力网络中得到时空特征;利用目标实体及部分关联实体的时空特征生成隐式提示,并将目标实体的显式的事件文本合并生成提示信息;将提示信息输入给大语言模型,保持大语言模型的参数固定不变,利用下游预测任务的标注信息和损失函数来训练空间注意力网络和时序注意力网络;最后根据训练好的网络来处理目标实体及部分关联实体的下游预测任务。

    基于实体词属性特征和回译的中文金融文本数据增强方法

    公开(公告)号:CN115048940B

    公开(公告)日:2024-04-09

    申请号:CN202210724689.7

    申请日:2022-06-23

    Abstract: 本发明公开了一种基于实体词属性特征和回译的中文金融文本数据增强方法。该方法包括:首先对输入的金融文本进行文本预处理工作;紧接着,通过命名实体识别和词汇匹配的方法对金融文本中翻译难度较大的实体词使用指代字符进行实体词指代替换以生成金融文本的中间文本和指代字符‑实体映射关系字典;之后,使用回译的方法增强金融文本的中间文本,并使用指代字符‑实体映射关系字典还原文本中的指代字符,进而生成与原文本语义相似的新文本。此外,本方法在中文金融文本的数据增强任务中,首次关注并分析了实体词属性特征对文本数据增强结果的影响,并将不同种类的实体词属性特征分层次处理,提高了数据增强后得到文本的质量。

    知识图谱构建方法、资源查找方法、计算机设备和介质

    公开(公告)号:CN116910277B

    公开(公告)日:2024-02-27

    申请号:CN202311179454.5

    申请日:2023-09-13

    Abstract: 本申请涉及一种知识图谱构建方法、资源查找方法、计算机设备和介质,通过获取资源对应的数据集,其中,资源包括天文学领域数据,数据集包括多个关键词以及每个关键词的属性,关键词的属性包括关键词在多个资源中的第一权重和关键词对应的资源标识;根据第一权重确定主关键词和副关键词,并将属于同一研究方向的副关键词与主关键词关联,其中,主关键词的第一权重大于副关键词的第一权重;分别在主关键词和副关键词之间构建知识图谱,其中,分别将主关键词和副关键词作为节点,将对应的资源标识和第一权重作为节点属性,将语义关系作为边,构建相应知识图谱,降低了知识图谱的规模,实现了关键词的交叉检索。

Patent Agency Ranking