一种面向结构化数据的预处理和补全方法

    公开(公告)号:CN115145906B

    公开(公告)日:2023-01-03

    申请号:CN202211068167.2

    申请日:2022-09-02

    Abstract: 本发明公开一种面向结构化数据的预处理和补全方法,包括:步骤一,对原始数据的缺失信息进行查询,统计缺失值,得到原始数据的缺失率;步骤二,根据缺失率对原始数据进行行列剔除处理,然后进行行遍历生成行对应数组,再将数组转换为直方图形式,计算出对应直方图构成的最大的矩形面积,接着对所有矩形面积进行排序,采集得到最大的完整信息矩阵;步骤三,采用基于链式方程进行的多重填补方法或基于编码器的多重填补方法或基于对抗生成网络的填补方法,对原始数据进行缺失值填补。本发明能够对原始数据进行缺失信息统计,自动搜寻满足条件的最大完整信息,补全结构化数据,极大提高原始数据集的质量,对后期的预测任务提供了便利。

    一种基于主从博弈的联邦数据差分隐私交易方法

    公开(公告)号:CN115511566A

    公开(公告)日:2022-12-23

    申请号:CN202211210034.4

    申请日:2022-09-30

    Inventor: 王海军 那崇宁

    Abstract: 本发明公开了一种基于主从博弈的联邦数据差分隐私交易方法,该方法在数据资源需求方与数据资源供应方之间运用联邦学习以及差分隐私计算进行数据信息的传输,在双方之间运用主从博弈理论进行数据的意愿出价τ以及意愿交付数据量χo的决策交流,进而实现数据需求方的意愿出价τ确定以及数据资源供应方的意愿交付数据量χo确定。相较于传统方法,本发明在数据资源供需双方交互的过程中不产生实际的数据交易行为并能够保证价格信息与数据信息的高效流通,有效地解决了数据资源供需双方的意愿出价τ与意愿交付数据量χo的交互及确定问题,有助于构建更加健康和可持续发展的数据交互和交易。

    一种两阶段车险反欺诈图像采集质检方法、装置和系统

    公开(公告)号:CN115410174A

    公开(公告)日:2022-11-29

    申请号:CN202211352917.9

    申请日:2022-11-01

    Abstract: 本发明公开一种两阶段车险反欺诈图像采集质检方法、装置和系统,该方法包括:步骤一,采集车险现场图片,标注车辆朝向;步骤二,对采集车险现场图片进行目标检测,筛选得到目标坐标;步骤三,根据车辆朝向和目标坐标,计算目标坐标位于整车的具体部位;步骤四,根据步骤二筛选得到的目标坐标,对车险现场图片进行车辆部件检测,得到车辆部件坐标,并进行筛选,得到距离目标坐标最近的车辆部件;步骤五,根据步得到的目标坐标位于整车的具体部位和距离目标坐标最近的车辆部件,得到距离目标坐标最近的车辆部件位于整车的位置,并抽象化为结构化数据。本发明避免了传统保险行业中存在的低质量图片,以及人工识别耗费的大量时间。

    面向多模态数据的车险欺诈行为预测系统、方法和装置

    公开(公告)号:CN114140025A

    公开(公告)日:2022-03-04

    申请号:CN202111520083.3

    申请日:2021-12-13

    Abstract: 本发明公开了一种面向多模态数据的车险欺诈行为预测系统、方法和装置,本发明从图片数据中抽取风险因子后,与对应结构化数据字段相结合,基于特征工程,机器学习,深度学习等算法,构建车险欺诈风险预测模型,对有风险的行为进行预警。在预测之后,对图片因子进行风险评估和重要性排序,对存在高风险,高权重的因子进行可视化表达。该方法可有效辅助人工进行风险评估,并利用不同种类图片的数据,实现模型和预测结果的可视化因果关系表达。本发明方法利用计算机视觉算法,对某些难以利用的图片数据进行因子抽取,并借助因子分析,因果推论等算法,对预测模型和结果进行可视化展示。

    一种多方数据协同场景下的隐私保护量化评估方法和系统

    公开(公告)号:CN112380572A

    公开(公告)日:2021-02-19

    申请号:CN202110051389.2

    申请日:2021-01-14

    Abstract: 本发明公开了一种多方数据协同场景下的隐私保护量化评估方法和系统,该方法为数据资源提供方根据算法和保护机制,将所述数据资源输入模型中进行训练,输出满足模型指标和阈值的模型,同时,数据资源提供方利用攻击手段,攻击上述模型,记录并量化模型的隐私泄露情况,输出隐私指标;数据资源使用方和数据资源提供方分别根据模型指标和隐私指标是否满足自身需要,做出是否进行数据合作的决策。本发明提升了在数据共享过程中对隐私风险和数据价值的有效评估和信息披露,有效解决数据资源提供方和数据使用需求方之间的信息不对称问题,有助于构建更加健康和可持续发展的数据共享、交互和交易体系。

    数据交易的匹配方法、装置、电子装置和存储介质

    公开(公告)号:CN117094826B

    公开(公告)日:2024-04-09

    申请号:CN202311261009.3

    申请日:2023-09-27

    Abstract: 本申请涉及一种数据交易的匹配方法、装置、电子装置和存储介质,其中,该数据交易的匹配方法包括:基于各数据提供方的第一语义特征,和各数据采购方的第二语义特征进行匹配,得到第一匹配结果;将第一语义特征和第一图谱特征融合,将第二语义特征和第二图谱特征融合,基于融合结果得到第二匹配结果;利用图计算方法对第二匹配结果进行交易对象分层,并根据分层结果构建交易反馈链路,以使匹配后的交易双方完成数据交易。其能够基于机器学习完成对数据提供方和数据采购方的交易需求的特征表征,进而基于特征表征完成数据提供方和数据采购方的匹配,从而为数据交易过程中的数据提供方和数据采购方实现精确的交易匹配。

    一种自适应规则引导的大语言模型生成SQL系统

    公开(公告)号:CN117131070B

    公开(公告)日:2024-02-09

    申请号:CN202311404243.7

    申请日:2023-10-27

    Abstract: 本发明公开了一种自适应规则引导的大语言模型生成SQL系统,包括:表结构构建模块,用于列名标准化和列名字典构建;参考规则库构建模块用于构建参考规则库,包括表和列名筛选子模块、列条件抽取子模块、合并表嵌套子模块、SQL片段生成子模块、校验子模块;常用规则库中包含实际业务场景中常用的Text到SQL的各个步骤和推理逻辑;自适应规则构建模块用于构建与Text查询语句匹配的自适应规则;规则引导SQL生成模块根据自适应规则,引导大语言模型逐步生成SQL语句。本发明能帮助非数据库技术人员实现自然语言查询转SQL语句,并避免隐含条件和模糊语义引起的列数据筛选条件错误等问题。

    一种基于时空静态信息自动化生成的预测方法及装置

    公开(公告)号:CN117494052A

    公开(公告)日:2024-02-02

    申请号:CN202311546933.6

    申请日:2023-11-17

    Abstract: 本说明书公开了一种基于时空静态信息自动化生成的预测方法及装置,可以分别通过第一嵌入网络和第二嵌入网络,得到业务对象的时序静态特征和时序静态关系图谱生成特征,并将业务对象的初始时序动态特征输入到时序动态网络中得到时序动态特征,根据时序动态特征与时序静态特征得到时序特征。而后,根据各业务对象的时序静态关系图谱生成特征生成时序静态关系图谱,将各业务对象的时序特征和时序静态关系图谱输入空间聚合网络,得到各业务对象的时空特征,从而可以通过目标业务对象的时空特征确定目标业务对象在预设时间段后的预测结果,通过预测结果对预测模型进行训练,以通过训练后的预测模型对目标业务对象的业务结果进行预测。

    一种面向公司资讯文本的事件抽取方法及系统

    公开(公告)号:CN116991983B

    公开(公告)日:2024-02-02

    申请号:CN202311259460.1

    申请日:2023-09-27

    Abstract: 本发明公开一种面向公司资讯文本的事件抽取方法及系统,该发明在面向公司资讯文本的事件抽取任务中,面对噪声公司名对模型性能干扰的难题,提出一种新的标注规则,将噪声公司名纳入实体识别的标注体系中,并设定噪声公司名对应的事件类别;将需要同时抽取公司名字段和判定公司名对应事件类型的噪音难题转换为简单的分类问题,极大地缓解了模型的压力,降低了任务的难度;并构建一种公司名及事件类型的两阶段抽取模型,提高了模型抽取公司名字段和判定公司名对应事件类别的精度。

    一种基于不完善异构关系网络图的风险预测方法及装置

    公开(公告)号:CN116882767B

    公开(公告)日:2024-01-05

    申请号:CN202311158959.3

    申请日:2023-09-08

    Abstract: 本说明书公开了一种基于不完善异构关系网络图的风险预测方法及装置,可以确定该目标业务对象及相关业务对象的初始特征,而后,根据异构关系网络图、初始特征和图结构调整参数,确定目标业务对象的综合特征。将该目标业务对象的综合特征输入到风险预测网络中,预测得到目标业务对象的风险程度。最后,根据目标业务对象的风险程度,确定针对目标业务对象的策略,并确定奖励,进而根据策略评价值和奖励,对特征提取网络、风险预测网络以及评价网络进行训练,以调整图结构调整参数,根据调整后的图结构调整参数,得到调整后的异构关系网络图,并根据调整后的异构关系网络图以及风险预测网络,实时进行风险预测,从而提高了风险预测的准确性。

Patent Agency Ranking