面向多模态数据的车险欺诈行为预测系统、方法和装置

    公开(公告)号:CN114140025B

    公开(公告)日:2025-03-07

    申请号:CN202111520083.3

    申请日:2021-12-13

    Abstract: 本发明公开了一种面向多模态数据的车险欺诈行为预测系统、方法和装置,本发明从图片数据中抽取风险因子后,与对应结构化数据字段相结合,基于特征工程,机器学习,深度学习等算法,构建车险欺诈风险预测模型,对有风险的行为进行预警。在预测之后,对图片因子进行风险评估和重要性排序,对存在高风险,高权重的因子进行可视化表达。该方法可有效辅助人工进行风险评估,并利用不同种类图片的数据,实现模型和预测结果的可视化因果关系表达。本发明方法利用计算机视觉算法,对某些难以利用的图片数据进行因子抽取,并借助因子分析,因果推论等算法,对预测模型和结果进行可视化展示。

    一种基于时空注意力机制的大语言模型预测方法及装置

    公开(公告)号:CN117786061A

    公开(公告)日:2024-03-29

    申请号:CN202311675342.9

    申请日:2023-12-06

    Abstract: 本说明书公开了一种基于时空注意力机制的大语言模型预测方法及装置,可以用于处理目标实体及部分关联实体的下游预测任务,包括:通过将目标实体及关联实体的初始特征和动态知识图谱输入到空间注意力网络中得到空间拓扑特征;将空间拓扑特征输入到时序注意力网络中得到时空特征;利用目标实体及部分关联实体的时空特征生成隐式提示,并将目标实体的显式的事件文本合并生成提示信息;将提示信息输入给大语言模型,保持大语言模型的参数固定不变,利用下游预测任务的标注信息和损失函数来训练空间注意力网络和时序注意力网络;最后根据训练好的网络来处理目标实体及部分关联实体的下游预测任务。

    一种基于博弈论的联邦学习隐私策略选择方法

    公开(公告)号:CN112926088B

    公开(公告)日:2024-03-19

    申请号:CN202110292473.3

    申请日:2021-03-18

    Abstract: 本发明公开了一种基于博弈论的联邦学习隐私策略选择方法,该方法包括:服务器为参与方提供具有不同服务成本的阈值,参与方根据是否满足服务质量、隐私泄露代价等来选择最佳阈值,并由服务器在下一次迭代训练中更新服务成本;服务器通过多次迭代来获得最优的模型参数,以此保持模型长期稳定的服务状态,并提供给参与方。该方法有效避免了参与方“搭便车”等恶意行为,使得服务器可以最大限度地得到服务费用,参与方可以获得长期的优质服务。

    基于GLM的金融事件抽取样本的生成方法及系统

    公开(公告)号:CN117312862B

    公开(公告)日:2024-02-27

    申请号:CN202311605593.X

    申请日:2023-11-29

    Inventor: 李栓 那崇宁

    Abstract: 本发明公开了一种基于GLM的金融事件抽取样本的生成方法及系统,包括:在语料库中查找每个事件类型对应的关键词并构建关键词字典,基于关键词字典查找每个样本中描述文本对应的关键词列表,其中关键词列表还包括每个样本对应的事件论元;基于关键词列表为每个样本查找关键词的候选替换词,构建候选替换词字典;对每个样本的原描述文本的非关键词进行掩码处理后,基于GLM对掩码处理后的描述文本进行掩码预测生成新描述文本;基于候选替换词字典将原描述文本和新描述文本中的关键词替换为候选替换词,以生成增强的金融事件抽取样本。该方法及系统能够生成质量和数量都满足要求的金融事件抽取样本数据。

    理赔欺诈识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN117078441B

    公开(公告)日:2024-02-06

    申请号:CN202311332282.0

    申请日:2023-10-16

    Abstract: 本申请涉及一种理赔欺诈识别方法、装置、计算机设备和存储介质,通过将历史理赔事件数据构建为用于表征历史理赔事件中各个事件元素与每个历史理赔事件关联关系的历史关联关系邻接矩阵组,根据历史关联关系邻接矩阵组,构建用于表征重要程度最高的事件元素下每个历史理赔事件关联关系的历史重要关联关系邻接矩阵,构建完成后,提取历史重要关联关系邻接矩阵组的历史特征向量,结合历史重要关联关系邻接矩阵,构建理赔欺诈识别模型,使用识别模型对待预测理赔事件进行风险判断,由于将事件的关联关系根据重要程度进行划分,因此突出了重要关联关系,解决了相关技术中理赔欺诈事件识别准确度较低的问题,提高了理赔欺诈事件(56)对比文件Shuhan Yuan等.Spectrum-based DeepNeural Networks for Fraud Detection.CIKM'17: PROCEEDINGS OF THE 2017 ACMCONFERENCE ON INFORMATION AND KNOWLEDGEMANAGEMENT.2017,2419-2422.Nannan Ning等.Comparison of SiliconLattice-Filter-Based O-Band 1times8 (De)Multiplexers With Flat and Gaussian-LikePassbands.IEEE.2022,第14卷(第4期),6615705.卢冰洁等.机器学习模型在车险欺诈检测的研究进展.计算机工程与应用.2022,第58卷(第5期),34-49.吕文韬.基于图采样与异质图神经网络的欺诈检测研究.中国优秀硕士学位论文全文数据库基础科学辑.2023,(第10期),A002-25.周晓楠;黄磊;王飞跃;储明;黄涛.图数据库在识别重大疾病保险团伙式欺诈中的应用研究.保险研究.2020,(第09期),全文.闫春;李亚琪;孙海棠.基于蚁群算法优化随机森林模型的汽车保险欺诈识别研究.保险研究.2017,(第06期),全文.

    数据异常值处理方法、装置、计算机设备和可读存储介质

    公开(公告)号:CN116756494B

    公开(公告)日:2024-01-23

    申请号:CN202311057175.1

    申请日:2023-08-22

    Abstract: 本申请涉及一种数据异常值处理方法、装置、计算机设备和可读存储介质。所述方法包括:获取多个单样本数据中的目标列数据以及多个特征列数据;基于多个所述单样本数据的历史数据,确定每个所述单样本数据的异常值处理次数;根据所述目标列数据对多个所述特征列数据进行分类,得到多个特征列数据组;基于异常值处理次数为多个所述特征列数据组分配对应的数据组处理次数;基于所述数据组处理次数,对相应特征列数据组中的特征列数据进行异常数据处理。采用本方法能够实现数据的预处理,且为特征列数据组分配恰当的异常值处理次数,确保良好的数据清洗效果的同时尽可能的减少数据处理时间和资源的浪费,大幅度提高数据异常(56)对比文件D. G. Perez等“.Outlier DetectionApplying an Innovative User TransactionModeling with Automatic Explanation”.《2011 IEEE Electronics, Robotics andAutomotive Mechanics Conference》.2012,全文.

    基于本地知识库与自然语言大模型的图查询方法与系统

    公开(公告)号:CN117009492B

    公开(公告)日:2024-01-09

    申请号:CN202311269299.6

    申请日:2023-09-28

    Abstract: 本申请涉及一种基于本地知识库与自然语言大模型的图查询方法与系统,其中,基于本地知识库与自然语言大模型的图查询方法包括:结合图数据库中获取的图谱结构与本地知识库文档,生成多个领域知识问题与图数据库查询命令的组合;将用户输入的问题转化为对应的向量,并确定与所述用户输入问题对应的向量相匹配的K个领域知识问题与图数据库查询命令的组合;将所述用户输入的问题与所述K个领域知识问题与图数据库查询命令的组合填充到预设的上下文提示模版,得到填充后的问题,并将填充后的问题输入至所述预训练自然语言大模型,生成最终的图数据库查询命令;使用所述最终的图数据库查询命令查询图数据库得到查询结果,提高了图查询结果的准确性。(56)对比文件徐健.基于知识图谱构建5G协议知识库.移动通信.2020,(第08期),全文.王仁武;袁毅;袁旭萍.基于深度学习与图数据库构建中文商业知识图谱的探索研究.图书与情报.2016,(第01期),全文.

    基于GLM的金融事件抽取样本的生成方法及系统

    公开(公告)号:CN117312862A

    公开(公告)日:2023-12-29

    申请号:CN202311605593.X

    申请日:2023-11-29

    Inventor: 李栓 那崇宁

    Abstract: 本发明公开了一种基于GLM的金融事件抽取样本的生成方法及系统,包括:在语料库中查找每个事件类型对应的关键词并构建关键词字典,基于关键词字典查找每个样本中描述文本对应的关键词列表,其中关键词列表还包括每个样本对应的事件论元;基于关键词列表为每个样本查找关键词的候选替换词,构建候选替换词字典;对每个样本的原描述文本的非关键词进行掩码处理后,基于GLM对掩码处理后的描述文本进行掩码预测生成新描述文本;基于候选替换词字典将原描述文本和新描述文本中的关键词替换为候选替换词,以生成增强的金融事件抽取样本。该方法及系统能够生成质量和数量都满足要求的金融事件抽取样本数据。

    理赔欺诈识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN117078441A

    公开(公告)日:2023-11-17

    申请号:CN202311332282.0

    申请日:2023-10-16

    Abstract: 本申请涉及一种理赔欺诈识别方法、装置、计算机设备和存储介质,通过将历史理赔事件数据构建为用于表征历史理赔事件中各个事件元素与每个历史理赔事件关联关系的历史关联关系邻接矩阵组,根据历史关联关系邻接矩阵组,构建用于表征重要程度最高的事件元素下每个历史理赔事件关联关系的历史重要关联关系邻接矩阵,构建完成后,提取历史重要关联关系邻接矩阵组的历史特征向量,结合历史重要关联关系邻接矩阵,构建理赔欺诈识别模型,使用识别模型对待预测理赔事件进行风险判断,由于将事件的关联关系根据重要程度进行划分,因此突出了重要关联关系,解决了相关技术中理赔欺诈事件识别准确度较低的问题,提高了理赔欺诈事件的识别效率。

    金融信贷场景下的数据链式存储方法、装置和系统

    公开(公告)号:CN117056426A

    公开(公告)日:2023-11-14

    申请号:CN202311015065.9

    申请日:2023-08-11

    Abstract: 本申请涉及一种金融信贷场景下的数据链式存储方法、装置和系统。所述方法包括:基于数据属性,对获取到的信贷交易流水数据进行拆分,生成对应的数据属性链下的新增节点数据,所述数据属性包括属性名称、属性类型、属性链首节点和属性链尾节点;对各所述数据属性链下的新增节点数据进行噪声检查;在所述噪声检查通过的情况下,基于所述新增节点数据,判断所述数据属性链下的所述属性链尾节点是否需要进行更新,若是,则在所述数据属性链下新建最新节点,并将所述新增节点数据存储至所述最新节点中。采用本方法能够解决传统信贷交易时交易数量量大、数据变化稀疏导致的存储资源浪费的问题,有效减少了存储资源的占用,提高了存储数据的实用性。

Patent Agency Ranking