-
公开(公告)号:CN113837252B
公开(公告)日:2024-03-26
申请号:CN202111072320.4
申请日:2021-09-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/23 , G06N3/0895
Abstract: 本说明书实施例提供了一种聚类处理方法和装置。根据该实施例的方法,首先获取利用被分析主体的相关数据构建的网络图,所述网络图包括节点和边,所述节点包括被分析主体,所述边的权重指示节点之间的相关性;然后利用所述网络图得到一阶标签传播概率矩阵;再基于所述一阶标签传播概率矩阵得到N阶标签传播概率矩阵,所述N为2以上的正整数,所述N阶标签传播概率矩阵包括各节点之间通过N阶以下方式传播标签的概率;然后利用所述N阶标签传播概率矩阵,进行节点之间的标签传播,直至满足预设的收敛条件;最后利用所述标签传播的结果,确定所述被分析主体的聚类结果。
-
公开(公告)号:CN113988175B
公开(公告)日:2024-06-11
申请号:CN202111253253.6
申请日:2021-10-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2323 , G06F18/2415 , G06F16/901 , G06F16/906 , G06N20/00
Abstract: 本说明书实施例提供了一种聚类处理的方法和装置。根据该实施例的技术方案,首先获取利用被分析主体的相关数据构建的网络图,网络图包括节点和边,节点包括被分析主体,边指示节点之间的相关性;然后利用网络图中已标注类别标签的第一节点集合训练聚类模型;再从网络图中未标注类别标签的第二节点集合中确定对应损失函数满足预设要求的n个节点,n为1以上的正整数;获取对n个节点标注的类别标签后,将n个节点加入第一节点集合,转至执行利用网络图中已标注类别标签的第一节点集合训练聚类模型,直至满足预设的训练结束条件;最后利用训练得到的聚类模型对网络图中的待聚类节点进行聚类处理,待聚类节点为第二节点集合中的部分或全部节点。
-
公开(公告)号:CN113657510A
公开(公告)日:2021-11-16
申请号:CN202110953954.4
申请日:2021-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书提供了一种有标注价值的数据样本的确定方法,先获取未标注数据样本集合,然后根据未标注数据样本集合中各数据样本的特征向量值的分布,估计出针对任一特征向量值的概率密度函数,使得根据概率密度函数,能够确定出任一特征向量值所在空间点的样本分布浓度。在确定未标注数据样本集合中的数据样本的标注价值度时,利用得到的概率密度函数确定每个数据样本的特征向量值所在空间点的数据样本浓度,浓度越小,说明该特征向量值对应的数据样本的数量,相对于其他特征向量值对应的数据样本的数量少很多,对平衡数据样本分布的贡献会更大,因此对预测模型的构建越有价值。
-
公开(公告)号:CN116306675A
公开(公告)日:2023-06-23
申请号:CN202310351953.1
申请日:2023-03-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/289 , G06F18/22 , G06F16/33 , G06F16/338
Abstract: 公开了一种基于语义相似度的关键词拓展识别方法,包括:接收文本数据;从该文本数据中提取候选关键词;确定每个候选关键词与预设关键词库中的预设关键词的第一语义相似度;确定每个候选关键词与预设干扰词库中的预设干扰词的第二语义相似度;基于每个候选关键词的第一语义相似度和第二语义相似度来确定每个候选关键词的待拓展度量;以及基于每个候选关键词的待拓展度量来识别出拓展关键词。还公开了基于语义相似度的关键词拓展识别系统和计算机可读存储介质。
-
公开(公告)号:CN113988175A
公开(公告)日:2022-01-28
申请号:CN202111253253.6
申请日:2021-10-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62 , G06F16/901 , G06F16/906 , G06N20/00
Abstract: 本说明书实施例提供了一种聚类处理的方法和装置。根据该实施例的技术方案,首先获取利用被分析主体的相关数据构建的网络图,网络图包括节点和边,节点包括被分析主体,边指示节点之间的相关性;然后利用网络图中已标注类别标签的第一节点集合训练聚类模型;再从网络图中未标注类别标签的第二节点集合中确定对应损失函数满足预设要求的n个节点,n为1以上的正整数;获取对n个节点标注的类别标签后,将n个节点加入第一节点集合,转至执行利用网络图中已标注类别标签的第一节点集合训练聚类模型,直至满足预设的训练结束条件;最后利用训练得到的聚类模型对网络图中的待聚类节点进行聚类处理,待聚类节点为第二节点集合中的部分或全部节点。
-
公开(公告)号:CN113837252A
公开(公告)日:2021-12-24
申请号:CN202111072320.4
申请日:2021-09-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种聚类处理方法和装置。根据该实施例的方法,首先获取利用被分析主体的相关数据构建的网络图,所述网络图包括节点和边,所述节点包括被分析主体,所述边的权重指示节点之间的相关性;然后利用所述网络图得到一阶标签传播概率矩阵;再基于所述一阶标签传播概率矩阵得到N阶标签传播概率矩阵,所述N为2以上的正整数,所述N阶标签传播概率矩阵包括各节点之间通过N阶以下方式传播标签的概率;然后利用所述N阶标签传播概率矩阵,进行节点之间的标签传播,直至满足预设的收敛条件;最后利用所述标签传播的结果,确定所述被分析主体的聚类结果。
-
公开(公告)号:CN111414945A
公开(公告)日:2020-07-14
申请号:CN202010169258.X
申请日:2020-03-12
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 纪忠光
Abstract: 本说明书一个或多个实施例提供了一种模型效能的波动识别方法及装置,该方法包括:获取目标模型的训练样本数据和预测业务数据;基于训练样本数据,对目标模型进行模型参数训练,确定各预设数据特征对目标模型的重要性评价变量的变量数值;以及基于训练样本数据,对各预设数据特征的样本标签区分能力进行识别,确定预设数据特征对目标模型的预测能力影响变量的变量数值;以及基于预测业务数据和训练样本数据,对各预测数据特征的特征分布差异进行识别,确定各预设数据特征的稳定性评价变量的变量数值;再根据确定出的各变量数值,确定目标模型的模型效能波动数据。
-
-
-
-
-
-