一种分布式语义轨迹相似性连接方法

    公开(公告)号:CN116050421A

    公开(公告)日:2023-05-02

    申请号:CN202211435601.6

    申请日:2022-11-16

    Abstract: 本发明一种分布式语义轨迹相似性连接方法,包括以下步骤:建立用于对两个数据集中语义相似的轨迹进行从文本维度、时间维度和空间维度进行定位的全局索引;根据给定的相似性阈值和各维度相似性权重值,对文本相似性、时间相似性和空间相似性的修剪边界进行选择;对全局索引过程进行剪枝,对缺少公共文本项、时间距离下界大于时间边界及空间距离大于空间边界的的轨迹对进行批量修剪;对批量修剪后的局部索引空间结点对,基于轨迹概要对轨迹对进行再次修剪;对再次修剪后的候选轨迹对,重建所有轨迹,计算轨迹间的确相似性以获得满足相似性阈值约束的轨迹对;该方法对现实世界语义轨迹集的广泛实验研究表明,在效率和可扩展性方面明显优于基线。

Patent Agency Ranking