-
公开(公告)号:CN115858569A
公开(公告)日:2023-03-28
申请号:CN202211325152.X
申请日:2022-10-26
Applicant: 之江实验室
IPC: G06F16/2453 , G06F16/2458 , G06F16/28
Abstract: 本发明公开了一种基于图搜索技术的数据表关联关系分类方法和装置,该方法依赖于数据表字段统计分类结果,构建了基于有向图表示的关联型数据表关联关系集合,并关联型数据表之间的关联关系进行可视化图展示。该方法运用图搜索技术构建关联型数据表关联关系集合,基于设定主表,构建了用于关联型数据表聚合的关联关系分类。该方法支持对数据表全连接性的检查,实现了关联型数据表关联关系的自动化生成。同时,该方法可自动定位主表位置,确定关联型数据表聚合的连接字段。该方法的主要创新点在于使用有向图表示关联型数据表之间的关联关系,借助图搜索算法寻找关联型数据表之间的关联关系。
-
公开(公告)号:CN114741504A
公开(公告)日:2022-07-12
申请号:CN202210219956.5
申请日:2022-03-08
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/30 , G06F40/194 , G06Q40/08
Abstract: 本发明公开了一种面向保险文本的样本采样方法与装置,该方法包括:基于语义的文本向量化和半监督采样两部分。半监督采样又分为最远点采样及标注,基于分布的再采样与再采样样本的标注,模型分类精度验证等步骤。本发明方法基于语义向量化结合半监督学习方法进行样本采样,在极少标注样本的条件下,可以实现媲美全样本标注的模型精度和鲁棒性,同时大幅减少模型训练的计算与时间成本。
-
公开(公告)号:CN114549216A
公开(公告)日:2022-05-27
申请号:CN202210054637.3
申请日:2022-01-18
Applicant: 之江实验室
Abstract: 本发明公开了一种基于专家规则的人工智能模型结果溯源方法及系统,用于解决人工智能模型预测结果缺乏可解释性的问题。本发明首先从保险公司中收集高质量的车险案件历史数据,根据专家规则将车险案件历史数据转化为图结构数据;再通过图结构数据构建图谱网络,基于网络表示学习模型训练得到专家因子向量和专家规则向量;然后采集被人工智能模型判定为风险案件的车险实时数据,计算已触发的专家因子集合,通过缺省填补的方式得到拟触发规则向量;随后计算专家规则向量与拟触发规则向量的相似度;最后通过返回高相似度的拟触发规则,为车险专家提供溯源。本发明方法在保证较小的溯源耗时的同时,也保证了溯源的质量。
-
公开(公告)号:CN118072119B
公开(公告)日:2025-04-08
申请号:CN202410055534.8
申请日:2024-01-15
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/82 , G06V10/77 , G06V10/762 , G06V10/75 , G06V10/764 , G06N3/0464 , G06N3/045 , G06N3/084 , G06N3/088
Abstract: 本发明公开了一种面向数据隐私保护的多源异质数据蒸馏方法和装置,该方法包括:首先获得待蒸馏的多源异质图像数据集并进行相应的数据预处理;其次利用卷积神经网络获得图像表征后利用无监督聚类方法对表征数据进行聚类;然后构建同时满足分布匹配和参数匹配的双层网络模型,匹配每个聚类簇中的质心点所对应的原始数据点作为合成数据集,通过异步更新机制,迭代更新合成数据集和网络参数直至模型收敛;最后获得蒸馏后的图像数据集。本发明能精准的识别多源异质图像数据集的隐含模式,并从每个隐含模式中合成一张最具代表性的图像数据集,最终达到数据隐私保护和数据压缩的目的。
-
公开(公告)号:CN117273963B
公开(公告)日:2024-06-07
申请号:CN202311550781.7
申请日:2023-11-21
Applicant: 之江实验室
IPC: G06Q40/08 , G06Q50/40 , G06F18/21 , G06F18/213
Abstract: 本申请涉及一种基于车险场景的风险识别方法和装置。所述方法包括:对获取到的车险场景预测数据集进行预处理,得到待预测特征;将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。采用本方法能够解决人工手段识别车险场景的风险效率低,准确性差的问题,实现对车险场景下风险案件的快速预测和对疑点的准确迅速定位。
-
公开(公告)号:CN116932780A
公开(公告)日:2023-10-24
申请号:CN202311179452.6
申请日:2023-09-13
Applicant: 之江实验室
Abstract: 本申请涉及一种天文知识图谱构建方法、资源查找方法、设备和介质,获取资源对应的天体信息,其中,天体信息包括天体的形态特征和天体的坐标;基于形态特征对天体分类,得到多个天体类别;根据天体的坐标计算同一天体类别下每两个天体之间的距离,将每个天体作为节点,将属于同一个天体类别的每两个天体进行关联,构建得到多个知识图谱;获取各天体的光谱特征,在任意第一知识图谱和第二知识图谱之间,将具备相似光谱特征的天体进行关联。通过本申请天文知识图谱构建方法,提高了构建的知识图谱的准确性,有利于相关人员基于知识图谱搜索系统、完善的天体信息。
-
公开(公告)号:CN116304891A
公开(公告)日:2023-06-23
申请号:CN202310590427.0
申请日:2023-05-24
Applicant: 之江实验室
IPC: G06F18/241 , G06N3/096 , G06N3/088 , G06F16/2452 , G06N3/08
Abstract: 本申请涉及一种基于多源数据迁移学习的类别预测方法和装置。所述方法包括:获取多个来自不同数据源的表格数据,基于表格数据确定不同的目标任务下的关键数据映射表;通过数据向量化获取表格数据中每个单元格的文本向量,根据文本向量对待训练的自监督表格模型进行预训练;基于关键数据映射表,通过自监督表格模型确定目标任务训练集;基于目标任务对自监督表格模型进行优化,得到待优化的目标表格模型,根据目标任务训练集训练待优化的目标表格模型,得到目标表格模型;通过目标表格模型确定待预测数据的类别。采用本方法能够解决业务相似的不同机构中存在的因表格结构差异导致的预处理工作繁重、业务模型无法迁移复用等难点问题。
-
公开(公告)号:CN113837886A
公开(公告)日:2021-12-24
申请号:CN202111085743.X
申请日:2021-09-16
Applicant: 之江实验室
Abstract: 本发明公开了一种基于知识图谱的车险理赔欺诈风险识别方法和系统,该方法通过解析、拆分历史车险案件的结构化数据,根据车险理赔反欺诈业务场景、理赔流程设计的本体,历史案件实例化为案件知识图谱后,使用子图关键节点筛选和图点集向量化,建立多个案件间高欺诈风险筛选模型。该方法将不同时间段的车险理赔案件放于同一知识图谱中,通过分析不同时间、相似节点特征,串联关联案件,从而提示新提交车险案件风险等级。该方法对新提交车险案件进行欺诈风险评估,提供历史关联或相似案件作为风险点参考,提高车险理赔业务欺诈案件治理能力。
-
公开(公告)号:CN113837886B
公开(公告)日:2024-05-31
申请号:CN202111085743.X
申请日:2021-09-16
Applicant: 之江实验室
Abstract: 本发明公开了一种基于知识图谱的车险理赔欺诈风险识别方法和系统,该方法通过解析、拆分历史车险案件的结构化数据,根据车险理赔反欺诈业务场景、理赔流程设计的本体,历史案件实例化为案件知识图谱后,使用子图关键节点筛选和图点集向量化,建立多个案件间高欺诈风险筛选模型。该方法将不同时间段的车险理赔案件放于同一知识图谱中,通过分析不同时间、相似节点特征,串联关联案件,从而提示新提交车险案件风险等级。该方法对新提交车险案件进行欺诈风险评估,提供历史关联或相似案件作为风险点参考,提高车险理赔业务欺诈案件治理能力。
-
公开(公告)号:CN117252555B
公开(公告)日:2024-04-09
申请号:CN202311507842.1
申请日:2023-11-14
Applicant: 之江实验室
Abstract: 本申请涉及一种基于车险场景的半自动化特征工程方法、系统和介质,其中,基于车险场景的半自动化特征工程方法包括:对各所述数据表中各字段进行分类,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;基于所述字段类型,生成各所述数据表之间的表连接关系;基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果,提高了车险事件识别的精确度。
-
-
-
-
-
-
-
-
-