-
公开(公告)号:CN110737804A
公开(公告)日:2020-01-31
申请号:CN201910893570.0
申请日:2019-09-20
Applicant: 华中科技大学
IPC: G06F16/90 , G06F16/901
Abstract: 本发明公开了一种基于活跃度布局的图处理访存优化方法及系统,属于计算机数据处理技术领域,包括:获得待处理的目标图的数据后,按照中介中心性降序顺序对顶点排序,并根据活跃百分比将排序结果划分为活跃顶点集和不活跃顶点集;将活跃顶点集聚集组织并存储;将不活跃顶点集聚集组织并存储后,将其等分为多个大小为C的顶点块,并将对应的出边切分为多个边块,每个边块包括一个或多个编号连续的顶点的出边,且每个边块不小于C,同时维护状态表TActvB和TActeB,以筛除不活跃顶点集中的无用数据;TActvB用于记录各顶点块的活跃性,TActeB用于记录各边块的活跃性及下一边块的偏移量。本发明能够减少图应用执行过程中的访存等待时间,提高图处理效率。
-
公开(公告)号:CN110717107A
公开(公告)日:2020-01-21
申请号:CN201910866302.X
申请日:2019-09-12
Applicant: 华中科技大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种面向社交网络的度偏置采样方法及系统,属于大数据处理领域,包括:在一轮游走中,随机选取一个未游走过的节点开始随机游走,并确定与其度数相匹配的游走路径长度阈值;从当前游走节点u的邻居节点中随机选取一个节点v,若d(v)<d(u),则以概率p(与d(v)/d(u)反相关)拒绝接受路径转移,使得游走路径转移至节点v后回溯至节点u,否则,接受路径转移;若游走路径的长度达到长度阈值,则记录节点序列,并转入对下一个未游走节点的随机游走;重复上述步骤直至所有节点在当前轮次都被游走过;若达到预设的游走次数,则采样结束,否则,设置所有节点为未游走过的节点,转入下一轮随机游走。本发明能够高效且精确地提取社交网络的拓扑信息。
-
公开(公告)号:CN110719106B
公开(公告)日:2021-08-31
申请号:CN201910923378.1
申请日:2019-09-27
Applicant: 华中科技大学
IPC: H03M7/36 , G06F16/901 , G06Q50/00 , G06K9/62
Abstract: 本发明公开了一种基于节点分类排序的社交网络图压缩方法及系统,属于大数据处理领域,包括:获得社交网络图中各节点的入度,以获得其中的零入度节点,将入度最高的前top‑k节点作为高入度节点,将其余节点作为社区节点;将高入度节点划分为不同的领域,并将相同领域内的高入度节点排序到一起;将社区节点划分为不同社区,并将相同社区内的社区节点排序到一起;将所有零入度节点一起排序到末尾;根据排序后的节点建立图邻接矩阵,并将每一行中连续的b个比特作为一个比特行;对于每一个节点,仅对其出邻居节点所在的比特行进行存储并进行固定长度的编码,从而完成对社交网络图的压缩。本发明能够保证图计算任务的运行性能并提高社交网络图的压缩率。
-
公开(公告)号:CN110719106A
公开(公告)日:2020-01-21
申请号:CN201910923378.1
申请日:2019-09-27
Applicant: 华中科技大学
IPC: H03M7/36 , G06F16/901 , G06Q50/00 , G06K9/62
Abstract: 本发明公开了一种基于节点分类排序的社交网络图压缩方法及系统,属于大数据处理领域,包括:获得社交网络图中各节点的入度,以获得其中的零入度节点,将入度最高的前top-k节点作为高入度节点,将其余节点作为社区节点;将高入度节点划分为不同的领域,并将相同领域内的高入度节点排序到一起;将社区节点划分为不同社区,并将相同社区内的社区节点排序到一起;将所有零入度节点一起排序到末尾;根据排序后的节点建立图邻接矩阵,并将每一行中连续的b个比特作为一个比特行;对于每一个节点,仅对其出邻居节点所在的比特行进行存储并进行固定长度的编码,从而完成对社交网络图的压缩。本发明能够保证图计算任务的运行性能并提高社交网络图的压缩率。
-
公开(公告)号:CN110737804B
公开(公告)日:2022-04-22
申请号:CN201910893570.0
申请日:2019-09-20
Applicant: 华中科技大学
IPC: G06F16/90 , G06F16/901
Abstract: 本发明公开了一种基于活跃度布局的图处理访存优化方法及系统,属于计算机数据处理技术领域,包括:获得待处理的目标图的数据后,按照中介中心性降序顺序对顶点排序,并根据活跃百分比将排序结果划分为活跃顶点集和不活跃顶点集;将活跃顶点集聚集组织并存储;将不活跃顶点集聚集组织并存储后,将其等分为多个大小为C的顶点块,并将对应的出边切分为多个边块,每个边块包括一个或多个编号连续的顶点的出边,且每个边块不小于C,同时维护状态表TActvB和TActeB,以筛除不活跃顶点集中的无用数据;TActvB用于记录各顶点块的活跃性,TActeB用于记录各边块的活跃性及下一边块的偏移量。本发明能够减少图应用执行过程中的访存等待时间,提高图处理效率。
-
-
-
-