-
公开(公告)号:CN114764440A
公开(公告)日:2022-07-19
申请号:CN202210396982.5
申请日:2022-04-15
Applicant: 中南林业科技大学
IPC: G06F16/335 , G06F16/35 , G06F40/247 , G06F40/279 , G06K9/62
Abstract: 本申请公开了一种基于图节点选取和优化的主体事件去重方法,包括:获取主体事件文本数据,提取主体事件,生成待检测主体事件;构建主体事件连通子图,得到TOP‑K个领导节点;对每一个主体事件连通子图中的领导节点分别与待检测主体事件进行相似度计算和属性相关度计算;根据相似度与属性相关度是否属于预设阈值区间内,判断是否为疑似重复事件;计算疑似重复事件与所连接节点之间的发展的时空距离和重要性变化程度;进一步确定疑似重复事件与所连接节点是否为明确重复事件。本申请通过图的结构实现实时去重检测,实现实时去重分析,并在后续计算中添加金融主体事件相关特征,以达到提高去重准确率的目标。
-
公开(公告)号:CN114764440B
公开(公告)日:2024-12-27
申请号:CN202210396982.5
申请日:2022-04-15
Applicant: 中南林业科技大学
IPC: G06F16/335 , G06F16/35 , G06F40/247 , G06F40/279 , G06F18/22
Abstract: 本申请公开了一种基于图节点选取和优化的主体事件去重方法,包括:获取主体事件文本数据,提取主体事件,生成待检测主体事件;构建主体事件连通子图,得到TOP‑K个领导节点;对每一个主体事件连通子图中的领导节点分别与待检测主体事件进行相似度计算和属性相关度计算;根据相似度与属性相关度是否属于预设阈值区间内,判断是否为疑似重复事件;计算疑似重复事件与所连接节点之间的发展的时空距离和重要性变化程度;进一步确定疑似重复事件与所连接节点是否为明确重复事件。本申请通过图的结构实现实时去重检测,实现实时去重分析,并在后续计算中添加金融主体事件相关特征,以达到提高去重准确率的目标。
-