-
公开(公告)号:CN105323732A
公开(公告)日:2016-02-10
申请号:CN201410247352.7
申请日:2014-06-05
Applicant: 中国移动通信集团公司
IPC: H04W4/14
Abstract: 本发明公开了一种非正常短消息识别方法,所述方法包括:获取在第Q个标注周期内的第一短消息集合,所述第一短消息集合为在所述第Q个标注周期内的经过人工标注的短消息的集合;获取所述第一短消息集合中对每一条短消息的人工标注记录;依据所述标注记录,为每一条短消息配置相应的标注序列;依据所述标注序列,确定在所述第Q个标注周期内与所述标注序列相对应的短消息是否为非正常短消息;同时,本发明还公开了一种非正常短消息识别装置。本发明能够解决由于人工标注出错而带来的垃圾短信识别准确率不高的问题,进而可提高在海量数据系统中垃圾短信识别的效率及准确率。
-
公开(公告)号:CN109408795A
公开(公告)日:2019-03-01
申请号:CN201710708318.9
申请日:2017-08-17
Applicant: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
Abstract: 本发明实施例公开了一种文本识别方法,所述方法包括:获取待识别文本,并对所述待识别文本进行编码处理,得到第一文本指纹;识别所述第一文本指纹所属的类别得到识别结果;若所述识别结果为可识别类别,对所述待识别文本进行类别分析得到所述待识别文本的反馈类别;根据所述识别结果与所述反馈类别,更新所述第一文本指纹对应的预设文本指纹库。本发明实施例同时还公开了一种文本识别设备、计算机可读存储介质和装置。
-
公开(公告)号:CN109408795B
公开(公告)日:2022-04-15
申请号:CN201710708318.9
申请日:2017-08-17
Applicant: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
IPC: G06F40/279 , H04W4/14
Abstract: 本发明实施例公开了一种文本识别方法,所述方法包括:获取待识别文本,并对所述待识别文本进行编码处理,得到第一文本指纹;识别所述第一文本指纹所属的类别得到识别结果;若所述识别结果为可识别类别,对所述待识别文本进行类别分析得到所述待识别文本的反馈类别;根据所述识别结果与所述反馈类别,更新所述第一文本指纹对应的预设文本指纹库。本发明实施例同时还公开了一种文本识别设备、计算机可读存储介质和装置。
-
公开(公告)号:CN105323732B
公开(公告)日:2018-12-04
申请号:CN201410247352.7
申请日:2014-06-05
Applicant: 中国移动通信集团公司
IPC: H04W4/14
Abstract: 本发明公开了一种非正常短消息识别方法,所述方法包括:获取在第Q个标注周期内的第一短消息集合,所述第一短消息集合为在所述第Q个标注周期内的经过人工标注的短消息的集合;获取所述第一短消息集合中对每一条短消息的人工标注记录;依据所述标注记录,为每一条短消息配置相应的标注序列;依据所述标注序列,确定在所述第Q个标注周期内与所述标注序列相对应的短消息是否为非正常短消息;同时,本发明还公开了一种非正常短消息识别装置。本发明能够解决由于人工标注出错而带来的垃圾短信识别准确率不高的问题,进而可提高在海量数据系统中垃圾短信识别的效率及准确率。
-
公开(公告)号:CN109413595B
公开(公告)日:2020-09-25
申请号:CN201710705910.3
申请日:2017-08-17
Applicant: 中国移动通信集团公司
Abstract: 本发明实施例公开了一种垃圾短信的识别方法、装置及存储介质;该方法可以包括:根据短信样本库中的短信样本以及每条短信样本对应的指示信息生成第一指纹库和第一分类器;其中,所述指示信息用于指示所述短信样本是否为垃圾短信;将所述短信样本库以及所述第一指纹库和所述第一分类器按照设定的蝶形交叉训练策略进行训练,得到训练后的第二指纹库和训练后的第二分类器;基于设定的串行验证策略以及所述第二指纹库和所述第二分类器将待验证短信进行验证,确定所述待验证短信的验证结果;其中,所述验证结果包括所述待验证短信为垃圾短信,或所述待验证短信不为垃圾短信。能够实现两种垃圾短信识别技术的互补,也同样能够提高识别的成功率。
-
公开(公告)号:CN109413595A
公开(公告)日:2019-03-01
申请号:CN201710705910.3
申请日:2017-08-17
Applicant: 中国移动通信集团公司
Abstract: 本发明实施例公开了一种垃圾短信的识别方法、装置及存储介质;该方法可以包括:根据短信样本库中的短信样本以及每条短信样本对应的指示信息生成第一指纹库和第一分类器;其中,所述指示信息用于指示所述短信样本是否为垃圾短信;将所述短信样本库以及所述第一指纹库和所述第一分类器按照设定的蝶形交叉训练策略进行训练,得到训练后的第二指纹库和训练后的第二分类器;基于设定的串行验证策略以及所述第二指纹库和所述第二分类器将待验证短信进行验证,确定所述待验证短信的验证结果;其中,所述验证结果包括所述待验证短信为垃圾短信,或所述待验证短信不为垃圾短信。能够实现两种垃圾短信识别技术的互补,也同样能够提高识别的成功率。
-
-
-
-
-