-
公开(公告)号:CN115358229A
公开(公告)日:2022-11-18
申请号:CN202210621468.7
申请日:2022-06-02
Applicant: 哈尔滨工业大学
IPC: G06F40/289 , G06F40/216 , G06K9/62
Abstract: 本发明涉及一种基于特征相似度与特征值相似度融合的快递地址聚类方法,包括以下步骤:S1:获取快递的下单数据,统一获取快递地址信息,并对下单数据进行预处理,得到原始数据集;S2:按照设定的行政地址划分规则进行分词处理,进行词频统计过滤停用词;S3:建立特征词抽取模型对特征词进行选取,然后对不同特征赋予不同的权值;S4:建立相似度计算公式,依照改进的相似度计算公式对抽取到的特征词进行相似度计算;S5:建立基于特征相似度和特征值相似度融合的层次聚类算法,对客户行政地址进行聚类;S6:对快递末端网点客户地址聚类结果进行可视化展示。