-
公开(公告)号:CN110275941A
公开(公告)日:2019-09-24
申请号:CN201910546136.5
申请日:2019-06-21
Applicant: 福州大学
Abstract: 本发明涉及一种基于粗化与局部重叠模块度的邮件挖掘方法,根据邮件头日志信息,构建邮件往来网络G;多次迭代遍历,将G中的三角形融合为一个复合节点,得到粗化后的图Gcn;根据Jaccard距离初始化Gcn中所有边对应节点的距离;迭代更新邻居节点间的距离直至所有距离收敛。距离小于1的节点属于同一群组,得到粗化图的群组划分Ccn;还原网络得到邮件往来网络的初始群组划分C;将距离为1的节点加入到使局部重叠模块度增量最大的群组集中得到重叠群组集合Cover;将Cover中群组节点数少于设定阈值的群组合并到与其紧密度最大的群组中,更新Cover最终得到邮件往来网络的群组划分C’输出最终的群组划分结果。本发明克服了传统模块度计算效率低的问题提高重叠群组发现的精度。
-
公开(公告)号:CN109003195A
公开(公告)日:2018-12-14
申请号:CN201810765470.5
申请日:2018-07-12
Applicant: 福州大学
IPC: G06Q50/00
Abstract: 本发明涉及一种基于三角形粗化与动态距离的重叠社区发现方法,包括:读取网络数据集,生成网络图G;将G中的三角形融合为一个复合节点,多次迭代遍历直至粗化率达到一定阈值,结束粗化过程,得到粗化后的图Gcoar;根据Jaccard距离初始化Gcoar中所有边对应节点的距离;考虑三种邻居的影响,迭代更新邻居节点间的距离,直至所有距离收敛;求得重叠社区集合Cover并更新Cover;还原网络,将被复合节点加入到复合节点的社区,最终得到C’;输出最终的社区划分结果。本发明一方面是采取基于三角形的粗化策略降低网络规模,应用于较大规模网络的社区发现,从而提高实践效率;另一方面是采用基于Attractor的动态距离处理机制,并结合相似度判断,因此能够有效地得到网络中重叠社区结构划分,并为网络聚类在重叠社区发现方向的发展提供有益补充。
-