-
公开(公告)号:CN110175221A
公开(公告)日:2019-08-27
申请号:CN201910411018.3
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
Abstract: 利用词向量结合机器学习的垃圾短信识别方法,所述方法包括下列操作步骤:(1)根据短信特征对垃圾短信进行第一步识别;(2)根据关键词对垃圾短信进行第二步识别;(3)计算短信的短信文本向量,使用支持向量机的方法对垃圾短信进行第三步识别;(4)计算短信的静态词向量矩阵,利用卷积神经网络对垃圾短信进行第四步识别;(5)计算短信的每一个分词的动态词向量,利用卷积神经网络对垃圾短信进行第五步识别。本发明方法采用无监督和有监督相结合的垃圾短信识别方法,能大幅度提高垃圾短信的识别准确率。
-
公开(公告)号:CN110175221B
公开(公告)日:2021-04-20
申请号:CN201910411018.3
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
IPC: G06F16/33 , G06F40/289 , G06N3/04
Abstract: 利用词向量结合机器学习的垃圾短信识别方法,所述方法包括下列操作步骤:(1)根据短信特征对垃圾短信进行第一步识别;(2)根据关键词对垃圾短信进行第二步识别;(3)计算短信的短信文本向量,使用支持向量机的方法对垃圾短信进行第三步识别;(4)计算短信的静态词向量矩阵,利用卷积神经网络对垃圾短信进行第四步识别;(5)计算短信的每一个分词的动态词向量,利用卷积神经网络对垃圾短信进行第五步识别。本发明方法采用无监督和有监督相结合的垃圾短信识别方法,能大幅度提高垃圾短信的识别准确率。
-
公开(公告)号:CN111708887B
公开(公告)日:2022-09-23
申请号:CN202010542354.4
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种自定义规则的多模型融合的不良呼叫识别方法,包括:构建规则策略模型:设置若干条规则,将多条规则通过逻辑运算符连接构成策略,并设置策略的模型融合方式,由所有策略构成规则策略模型;构建识别不良呼叫的卷积神经网络和基于不良呼叫投诉的BERT文本分类模型;根据策略包含的规则的计算式,为每条策略生成递归计算表达式,然后执行递归计算表达式以获得策略执行结果,同时,运行卷积神经网络和BERT文本分类模型以获得输出结果,最后根据每条策略的模型融合方式和执行结果、卷积神经网络和BERT文本分类模型的输出结果,计算得到不良呼叫识别结果。本发明属于信息技术领域,能将规则和隐性表征模型有效融合到不良呼叫识别技术中。
-
公开(公告)号:CN111669757B
公开(公告)日:2023-03-14
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN111708887A
公开(公告)日:2020-09-25
申请号:CN202010542354.4
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种自定义规则的多模型融合的不良呼叫识别方法,包括:构建规则策略模型:设置若干条规则,将多条规则通过逻辑运算符连接构成策略,并设置策略的模型融合方式,由所有策略构成规则策略模型;构建识别不良呼叫的卷积神经网络和基于不良呼叫投诉的BERT文本分类模型;根据策略包含的规则的计算式,为每条策略生成递归计算表达式,然后执行递归计算表达式以获得策略执行结果,同时,运行卷积神经网络和BERT文本分类模型以获得输出结果,最后根据每条策略的模型融合方式和执行结果、卷积神经网络和BERT文本分类模型的输出结果,计算得到不良呼叫识别结果。本发明属于信息技术领域,能将规则和隐性表征模型有效融合到不良呼叫识别技术中。
-
公开(公告)号:CN111669757A
公开(公告)日:2020-09-15
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN106791227B
公开(公告)日:2019-08-20
申请号:CN201611037068.2
申请日:2016-11-23
Applicant: 杭州东信北邮信息技术有限公司
Abstract: 一种基于通话数据来识别用户常用联系人的方法和系统,当主叫用户向被叫用户发起呼叫时,所述方法包括有:提取本次呼叫的主、被叫用户在一定时间周期内的相互通话记录,根据所提取的通话记录来统计主、被叫用户之间在一定时间周期内的若干通话指标,然后根据所述若干通话指标来计算主叫用户对于被叫用户的联系标识符,以识别主叫用户是否是被叫用户的常用联系人,其中,主叫用户对于被叫用户的联系标识符用于标识主、被叫用户之间是否存在频繁通话关系。本发明属于网络通信技术领域,能基于用户和其通话号码之间的历史通话数据,实时识别其通话号码是否是用户的常用联系人。
-
公开(公告)号:CN106331390A
公开(公告)日:2017-01-11
申请号:CN201611036866.3
申请日:2016-11-23
Applicant: 杭州东信北邮信息技术有限公司
CPC classification number: H04M3/4365 , H04M1/665
Abstract: 一种基于通话数据来识别诈骗号码的方法和系统,当主叫用户向被叫用户发起呼叫时,方法包括有:步骤A、提取本次呼叫的主叫用户在当前时间周期内的所有通话记录,并从其所有通话记录中提取出主叫用户在当前时间周期内的所有通话号码,从而构成主叫用户的通话号码集;步骤B、根据所提取的通话记录来统计主叫用户和其所有通话号码在当前时间周期内的若干通话指标,然后根据所述若干通话指标来计算主叫号码的诈骗标识符,以识别主叫号码是否是疑似诈骗号码。本发明属于网络通信技术领域,能从现网所有发起呼叫的主叫号码中快速识别出疑似诈骗号码,从而有效防范电信诈骗。
-
公开(公告)号:CN106331390B
公开(公告)日:2019-04-30
申请号:CN201611036866.3
申请日:2016-11-23
Applicant: 杭州东信北邮信息技术有限公司
Abstract: 一种基于通话数据来识别诈骗号码的方法和系统,当主叫用户向被叫用户发起呼叫时,方法包括有:步骤A、提取本次呼叫的主叫用户在当前时间周期内的所有通话记录,并从其所有通话记录中提取出主叫用户在当前时间周期内的所有通话号码,从而构成主叫用户的通话号码集;步骤B、根据所提取的通话记录来统计主叫用户和其所有通话号码在当前时间周期内的若干通话指标,然后根据所述若干通话指标来计算主叫号码的诈骗标识符,以识别主叫号码是否是疑似诈骗号码。本发明属于网络通信技术领域,能从现网所有发起呼叫的主叫号码中快速识别出疑似诈骗号码,从而有效防范电信诈骗。
-
公开(公告)号:CN106791227A
公开(公告)日:2017-05-31
申请号:CN201611037068.2
申请日:2016-11-23
Applicant: 杭州东信北邮信息技术有限公司
Abstract: 一种基于通话数据来识别用户常用联系人的方法和系统,当主叫用户向被叫用户发起呼叫时,所述方法包括有:提取本次呼叫的主、被叫用户在一定时间周期内的相互通话记录,根据所提取的通话记录来统计主、被叫用户之间在一定时间周期内的若干通话指标,然后根据所述若干通话指标来计算主叫用户对于被叫用户的联系标识符,以识别主叫用户是否是被叫用户的常用联系人,其中,主叫用户对于被叫用户的联系标识符用于标识主、被叫用户之间是否存在频繁通话关系。本发明属于网络通信技术领域,能基于用户和其通话号码之间的历史通话数据,实时识别其通话号码是否是用户的常用联系人。
-
-
-
-
-
-
-
-
-