-
公开(公告)号:CN119848201A
公开(公告)日:2025-04-18
申请号:CN202411934990.6
申请日:2024-12-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/3329 , G06F16/383 , G06F16/36 , G06F16/334 , G06N5/04 , G06F40/295 , G06F18/22 , G06N3/0455 , G06N3/045 , G06N3/088 , G06N3/0895 , G06N3/09
Abstract: 本申请一个或多个实施例提供一种信息检索方法和装置,该方法包括:获取用于触发信息检索的查询文本,并针对查询文本进行命名实体识别,以从查询文本中识别出实体词作为检索实体词;基于图,计算各个候选实体词相对于检索实体词的关联度;其中,图中的各个节点代表各个候选实体词,图中的各条边连接的节点代表的候选实体词存在关联关系;将相对于检索实体词的关联度最高的预设数量的候选实体词确定为关联实体词,并根据关联实体词相对于检索实体词的关联度,计算各个候选文档相对于查询文本的关联度;将相对于查询文本的关联度最高的预设数量的候选文档确定为关联文档,并将关联文档确定为与查询文本对应的信息检索结果。
-
公开(公告)号:CN118964681A
公开(公告)日:2024-11-15
申请号:CN202411144868.9
申请日:2024-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06F18/214 , G06F18/2113 , G06N3/082
Abstract: 本说明书提供一种基于图数据的特征筛选方法和系统,其中,方法应用于分布式系统中的目标工作节点,分布式系统包括多个工作节点和控制节点,控制节点分别与每一工作节点连接,目标工作节点为多个工作节点中的任意工作节点,方法包括:获得由控制节点为目标工作节点分配的目标子图,根据目标子图对所述图数据的待筛选特征集进行筛选,得到筛选结果,其中,待筛选特征集中包括多个待筛选特征,筛选结果包括多个待筛选特征在实际应用场景下的重要性信息,向控制节点反馈所述筛选结果。通过利用分布式系统的方式进行特征筛选,显著减少了特征筛选过程中的时间和计算成本,提高了特征选择效率。尤其适合于数据量大、特征维度高的应用场景。
-
公开(公告)号:CN117743464A
公开(公告)日:2024-03-22
申请号:CN202311786159.6
申请日:2023-12-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/27 , G06F16/901 , H04L67/1095 , H04L67/1097
Abstract: 本说明书实施例提供图数据切分方法及装置。在进行图数据切分时,首先,基于图数据中的图节点的节点度数,根据计算负载均衡分配算法对图节点进行分区切分,以将图节点作为分区主图节点切分到图数据分区。随后,将分区主图节点的关联边的边数据分配到对应图数据分区,所述关联边包括出边和/或入边;并且构建所分配的关联边的与分区主图节点相对的另一图节点的副本,以作为镜像图节点保存到对应的图数据分区。
-
公开(公告)号:CN118887005A
公开(公告)日:2024-11-01
申请号:CN202410994960.8
申请日:2024-07-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/03 , G06F18/213 , G06F18/20 , G06N20/00 , G06N5/045
Abstract: 本说明书一个或多个实施例提供一种信贷风险评估方法、装置、设备及存储介质,该方法包括:从图数据的多个节点中,选取待进行评估的目标节点;根据所述目标节点在所述图数据中确定多个子图;通过第一聚合函数将所述子图中第一节点的用户信贷特征聚合到所述子图中的目标节点上,得到聚合特征;从所述聚合特征中选取输入至机器学习模型的目标特征,所述机器学习模型用于预测用户的信贷风险。通过将子图中其他节点的特征聚合到目标节点上,得到具有业务含义的聚合特征,提高了机器学习模型在处理过程中的可解释性;基于图数据提取各个目标特点的聚合特征来进行预测,减少了处理的数据量,也有利于提高机器学习模型处理过程的可解释性。
-
公开(公告)号:CN117216326A
公开(公告)日:2023-12-12
申请号:CN202311250232.8
申请日:2023-09-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06F16/215 , G06F16/22
Abstract: 本公开提供一种无效数据表的识别方法、装置、设备及存储介质,该方法中,响应于识别请求,获取基于数据表集合中的数据表和数据表之间的生产关系创建的有向图;有向图中各个节点表示数据表集合中的各个数据表;有向图中有向边表示该有向边连接的节点对应的数据表之间的生产关系;遍历有向图,搜索出有向图中包含的携带有效访问属性信息的有效访问节点,并将搜索到的有效访问节点和有向图的根节点之间的路径上的所有节点确定为有效链路节点;有效访问属性信息用于表示与该有效访问节点对应的数据表的数据所有者,在预设时长范围内针对该数据表进行了访问;将有向图中除有效链路节点之外的其他各个节点对应的数据表,确定为待清理的无效数据表。
-
公开(公告)号:CN119622297A
公开(公告)日:2025-03-14
申请号:CN202411758871.X
申请日:2024-12-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/211 , G06F18/213
Abstract: 本说明书提供一种图数据的处理方法及系统。该方法中,图数据的处理系统可以确定初始的特征维度集合,并基于该特征维度集合、以及图数据中与目标任务相关的关键节点集合,对图数据中的多个子图进行特征提取,进而基于特征提取结果在特征维度集合中剔除在目标任务下重要程度较低的特征维度,将特征维度集合中剩余的特征维度作为关键特征维度。这样的方式实现了对初始的特征维度集合进行自动化处理,以从初始的特征维度集合中筛选得到对于目标任务的重要程度相对较高的关键特征维度。
-
-
-
-
-