一种垃圾短信识别方法与系统

    公开(公告)号:CN104602206A

    公开(公告)日:2015-05-06

    申请号:CN201410854776.X

    申请日:2014-12-31

    CPC classification number: H04W4/14 G06F16/20 H04W12/12

    Abstract: 本发明公开了一种垃圾短信识别方法和系统,检索垃圾短信关键词时以字为单位,实现了从数量众多的有序规则中包含的数量庞大的关键词的处理,简化到有限的字的处理,通过在关键词库数据结构中逐层匹配得到关键词,短信中关键词的查找借助根据关键词构造的哈希森林,深度仅有1~2层,每一层代表所有需要检索的关键词组的字,层内采用哈希查找,查找出目标关键词后再根据有序规则数据结构判断关键词是否依次满足预置规则的关键词组合内容与要求的顺序,由于算法时间复杂度仅与哈希森林的平均深度有关,所以可以在规则多且复杂、关键词数量众多的情况下保证算法时间复杂度为常数,从而实现了快速地对短信中的垃圾短信进行识别。

Patent Agency Ranking