-
公开(公告)号:CN117290554B
公开(公告)日:2024-03-01
申请号:CN202311590588.6
申请日:2023-11-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供了一种基于图数据的业务规则确定方法及装置。图数据包括代表业务对象的节点以及节点之间的连接边,用来存储与业务数据相关的隐私数据。在该方法中,通过图神经网络确定图数据中的节点表征。将若干备选规则与匹配的实例子图进行结合,得到若干推理子图,备选规则包括推理条件和推理结果,任意一个推理子图包含推理条件数据和推理结果数据。接着,利用节点表征确定若干推理子图中各自的推理结果数据成立的概率评分,基于与任意一个备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度,基于若干备选规则的置信度对若干备选规则进行筛选,得到图数据的
-
公开(公告)号:CN117520898A
公开(公告)日:2024-02-06
申请号:CN202311548634.6
申请日:2023-11-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/24 , G06F18/214 , G06N3/0464 , G06N3/09
Abstract: 本说明书的实施例提供了一种用于识别敏感样本的方法、模型训练方法和装置。在该用于识别敏感样本的方法中,获取待识别的样本数据集,其中,所述样本数据集中的各个样本数据包括特征数据;先利用样本分组模型根据各个样本数据的特征数据得到用于指示各个样本数据所属分组的分组信息;再利用因果预测模型根据各个样本数据的特征数据和对应的分组信息得到各个样本数据对应的在处理变量的各个取值下的结果预测值;根据所得到的各个分组中的样本数据对应的在处理变量的各个取值下的结果预测值,确定各个分组对应的敏感系数;将敏感系数最高的分组中的样本数据确定为敏感样本。
-
公开(公告)号:CN117351324B
公开(公告)日:2024-03-01
申请号:CN202311647324.X
申请日:2023-12-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/82 , G06V30/19 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本公开提供一种通过神经网络模型进行文档图像处理的方法及装置,神经网络模型预先通过整体训练得到,其中至少包括匹配预测网络和逻辑交互网络,方法包括:从包含文档内容的目标图像中识别出多个文字;对于多个文字中任意两个文字构成的文字组合,使用匹配预测网络,得到文字组合属于同一语义字段的第一概率;在逻辑交互网络中,根据与文档理解相关的若干条约束规则,更新各个文字组合对应的第一概率,得到各个文字组合对应的第二概率;基于各个文字组合对应的第二概率,确定多个文字各自所属的语义字段。该实施方式使用包括约束规则的神经网络模型确定文档图像中多个文字各自所属(56)对比文件孙忠严.“逻辑规则增强的中医实体表示学习与应用研究”《.中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2023,第2023年卷(第10期),第E056-3页.Rinon Gal et.al..“Cardinal graphconvolution framework for documentinformation extraction”《.Proceedings ofthe ACM Symposium on Document Engineering2020》.2020,第7卷第1–11页.张雪;孙宏宇;辛东兴;李翠平;陈红.自动术语抽取研究综述.软件学报.2020,(第07期),第136-168页.
-
公开(公告)号:CN116977107A
公开(公告)日:2023-10-31
申请号:CN202310942728.5
申请日:2023-07-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q50/00 , G06F16/901 , G06F16/2458 , G06F18/22
Abstract: 本说明书一个或多个实施例提供一种社区划分方法及装置,涉及计算机技术领域。该方法包括获取待划分的多个节点;将多个节点划分为至少一个初始社区;针对多个节点中的每两个节点,分别构建每个初始社区中该两个节点的共同邻居集合,共同邻居集合用于表征该两个节点之间的紧密度;结合多个节点中每两个节点在每个初始社区中的紧密度,对多个节点进行重新划分,得到至少一个最终社区。本说明书提供的方案,通过预先将节点划分为多个初始社区,能够提升社区划分效率,并且由于本说明书中节点间的紧密度通过共同邻居集合度量,因此紧密度的表征与节点或边的类型无关,使本申请能够准确的表征异构网络下各节点之间的关系,从而提升社区划分的准确性。
-
公开(公告)号:CN112507074A
公开(公告)日:2021-03-16
申请号:CN202011436272.8
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F16/36 , G06N5/04
Abstract: 本说明书实施例提供一种机器阅读理解中的数值推理方法和装置。方法包括:获取当前问题和当前文本;确定当前问题和当前文本中包括的各实体和各数字,以及各数字分别对应的类型;构建关系网络图,包括对应于各实体的实体节点,和对应于各数字的数字节点,在相同类型的数字节点之间,以及具有预设关系的实体节点和数字节点之间,通过连接边形成邻居;确定当前问题对应的第一问题表征向量,以及关系网络图中各节点的初始表征向量;基于各节点的初始表征向量,对所述关系网络图中的各节点进行预定次数的迭代,以得到各节点的更新表征向量。能够提高机器阅读理解中的数值推理处理复杂问题的能力。
-
公开(公告)号:CN117520899A
公开(公告)日:2024-02-06
申请号:CN202311549529.4
申请日:2023-11-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/24 , G06F18/214 , G06F17/16 , G06N3/0464 , G06N3/09
Abstract: 本说明书的实施例提供了一种因果效应估计模型的训练方法、因果效应估计方法和装置。在该因果效应估计模型的训练方法中,利用包括特征数据、结果数据和作为处理变量的处理数据的训练样本集执行以下训练:利用当前分组模型根据各个当前训练样本的特征数据得到对应的所属分组信息;利用当前因果估计模型根据各个当前训练样本对应的所属分组信息、特征数据和处理变量的各个取值得到各个当前训练样本在处理变量的各个取值下对应的结果预测值;根据各个当前训练样本的结果数据与相匹配的结果预测值之间的差异确定当前因果估计模型训练过程的因果估计损失值,进而根据所确定的因果估计损失值调整当前因果估计模型的模型参数,直到满足训练结束条件。
-
公开(公告)号:CN111241851A
公开(公告)日:2020-06-05
申请号:CN202010329730.1
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/289 , G06K9/62
Abstract: 本说明书提供一种语义相似度确定方法、装置及处理设备,预先建立的语义相似度模型从两个不同的角度处理句子对,既考虑了文本句子的维度,又结合了文本单词级交叉矩阵的角度。在需要对待处理文本进行语义相似度的计算时,可以直接利用建立好的语义相似度模型中的语句语义确定子模型对待处理文本分别进行语义编码,将待处理文本分别转换为向量表示,基于转换后的向量对待处理文本进行相似度计算。在确保语义相似度计算效率的基础上,提高了语义相似度计算的准确性。
-
公开(公告)号:CN117290554A
公开(公告)日:2023-12-26
申请号:CN202311590588.6
申请日:2023-11-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供了一种基于图数据的业务规则确定方法及装置。图数据包括代表业务对象的节点以及节点之间的连接边,用来存储与业务数据相关的隐私数据。在该方法中,通过图神经网络确定图数据中的节点表征。将若干备选规则与匹配的实例子图进行结合,得到若干推理子图,备选规则包括推理条件和推理结果,任意一个推理子图包含推理条件数据和推理结果数据。接着,利用节点表征确定若干推理子图中各自的推理结果数据成立的概率评分,基于与任意一个备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度,基于若干备选规则的置信度对若干备选规则进行筛选,得到图数据的业务规则,用于进行业务处理。
-
公开(公告)号:CN111737419B
公开(公告)日:2020-12-04
申请号:CN202010759810.0
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F16/36 , G06N5/04
Abstract: 本说明书实施例提供一种机器阅读理解中的数值推理方法和装置。方法包括:获取当前问题和当前文本;确定当前问题和当前文本中包括的各实体和各数字,以及各数字分别对应的类型;构建关系网络图,包括对应于各实体的实体节点,和对应于各数字的数字节点,在相同类型的数字节点之间,以及具有预设关系的实体节点和数字节点之间,通过连接边形成邻居;确定当前问题对应的第一问题表征向量,以及关系网络图中各节点的初始表征向量;基于各节点的初始表征向量,对所述关系网络图中的各节点进行预定次数的迭代,以得到各节点的更新表征向量。能够提高机器阅读理解中的数值推理处理复杂问题的能力。
-
公开(公告)号:CN111291552A
公开(公告)日:2020-06-16
申请号:CN202010384219.1
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/232 , G06F40/30
Abstract: 本说明书实施例公开了一种文本内容修正的方法及系统。所述方法包括:获取待检测文本;生成所述待检测文本中各个字符对应的语义向量;对于每个所述语义向量,确定该语义向量在修正矩阵中对应的修正向量,进而将所述修正向量对应的字符作为修正后的字符;所述修正矩阵包括所述字符集中各字符的修正向量,其基于词嵌入矩阵和混淆特征矩阵生成;所述混淆特征矩阵基于所述词嵌入矩阵和混淆关系图,通过混淆模型获得;所述混淆关系图表示字符之间的符号近似关系;所述词嵌入矩阵包括字符集中各字符的词嵌入向量。
-
-
-
-
-
-
-
-
-