数据处理方法、装置、存储介质及程序产品

    公开(公告)号:CN115563097A

    公开(公告)日:2023-01-03

    申请号:CN202110749898.2

    申请日:2021-07-02

    Inventor: 殷晖 陈秦星 胥皇

    Abstract: 本申请涉及一种数据处理方法、装置、存储介质及程序产品,所述方法应用于分布式系统中,所述分布式系统包括分流指引节点和多个处理节点,所述方法包括:所述分流指引节点接收数据,根据所述动态索引中的各分区的参数,从所述多个分区中选择所述数据归属的分区;所述分流指引节点将所述数据输出至选择出的分区对应的处理节点,其中,归属于同一分区的数据在所述处理节点上用于聚类;所述分流指引节点根据归属于所述选择出的分区的数据更新所述动态索引。本申请实施例的数据处理方法能够实现提高属于同一社团的数据流入同一节点的概率,减小“聚类割裂问题”带来的不良影响,提高流式聚类效果。

Patent Agency Ranking