-
公开(公告)号:CN115525758A
公开(公告)日:2022-12-27
申请号:CN202210628092.2
申请日:2022-06-06
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于SVM的特定文本大数据分析方法及系统,所述一种基于SVM的特定文本大数据分析方法包括:利用历史特定文本大数据得到历史特定文本大数据特征;利用所述历史特定文本大数据特征获取历史特定文本大数据分析结果,采用SVM的大数据分析系统的技术,全面提高特定文本的分类的准确性和覆盖率,通过在海量数据中实现对特定内容的精准分类,大大提高了特定内容分类的及时性和准确性,从而提高了系统层面对特定内容处理的流转环节,大大提高了应用系统的处理能力。
-
公开(公告)号:CN115238703A
公开(公告)日:2022-10-25
申请号:CN202210616914.5
申请日:2022-06-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/35 , G06N20/00
Abstract: 本发明涉及一种包含历史深度语义特定文本的识别方法及系统,所述一种包含历史深度语义特定文本的识别方法包括:利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始数据;利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果,通过大数据分析特定文本进行模型训练,并对特定内容的语义特征进行分析筛除,进而进行分类、识别及定性,提升了对于特定文本的识别准确率,避免误差的产生。
-
公开(公告)号:CN110942783A
公开(公告)日:2020-03-31
申请号:CN201910978660.X
申请日:2019-10-15
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明涉及一种基于音频多级聚类的群呼型骚扰电话分类方法,该方法包括:S100,将包括有多个音频数据的音频池划分为多个等同分组,将每个分组依次进行特征提取及特征对比,进而执行聚类分析,得到音频聚类;S200,将音频进行语音转写,将语音转写的文本进行关键词库检索对比,得到关键词对比结果;S300,将音频聚类执行音频库检索对比,得到音频聚类结果;S400,对所述关键词对比结果及音频聚类结果进行合并分析,得到自动分类的群呼型骚扰电话。本发明的有益效果为:能够有效检测和发现群呼型骚扰电话;结合关键词、文本转写等手段,对骚扰电话实现了自动分类,节省了人工成本,提高了效率。
-
公开(公告)号:CN115914056B
公开(公告)日:2024-12-17
申请号:CN202110914688.4
申请日:2021-08-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L43/50 , H04L65/1104 , H04L67/02 , H04L67/141
Abstract: 本申请提供一种网络电话服务端的识别方法及装置、系统、电子设备,该方法包括:获取SIP流量,对SIP流量进行分析,获得目的IP信息;根据目的IP信息,对目标服务端的通信端口进行扫描,查找开放服务的目标端口;与开放服务的目标端口建立连接,并向开放服务的目标端口发送HTTP报文;根据HTTP报文的响应消息,确定目标服务端是否为网络电话服务端。由此可以高效地过滤出网络中大部分的VoIP运营平台信息,比传统的被动解析方式需要的资源更少且更加灵活,比传统的主动方式更加高效、目的性更强。在消耗少量资源的情况下,可以高效的进行定向分析,大大提高整体分析的高效性。
-
公开(公告)号:CN111669757B
公开(公告)日:2023-03-14
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN110942783B
公开(公告)日:2022-06-17
申请号:CN201910978660.X
申请日:2019-10-15
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明涉及一种基于音频多级聚类的群呼型骚扰电话分类方法,该方法包括:S100,将包括有多个音频数据的音频池划分为多个等同分组,将每个分组依次进行特征提取及特征对比,进而执行聚类分析,得到音频聚类;S200,将音频进行语音转写,将语音转写的文本进行关键词库检索对比,得到关键词对比结果;S300,将音频聚类执行音频库检索对比,得到音频聚类结果;S400,对所述关键词对比结果及音频聚类结果进行合并分析,得到自动分类的群呼型骚扰电话。本发明的有益效果为:能够有效检测和发现群呼型骚扰电话;结合关键词、文本转写等手段,对骚扰电话实现了自动分类,节省了人工成本,提高了效率。
-
公开(公告)号:CN113742478A
公开(公告)日:2021-12-03
申请号:CN202010474192.5
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06N3/04
Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。
-
公开(公告)号:CN111669757A
公开(公告)日:2020-09-15
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN109359126A
公开(公告)日:2019-02-19
申请号:CN201811009136.3
申请日:2018-08-30
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F16/242 , G06F16/2453
Abstract: 本发明属于数据查询技术领域,具体而言,涉及一种基于业务用户习惯的智能学习查询模型的构建方法,包括如下步骤:S1、从数据源中获取业务用户的数据查询记录;S2、根据步骤S1中得到的所述数据查询记录,进行数据查询习惯分析;S3、根据步骤S2中得到的数据查询习惯分析结果构建查询模型。本发明还提供了一种基于业务用户习惯的智能学习查询系统。本发明通过对业务用户的数据查询习惯进行分析,针对分析结果制定数据查询方案,构建查询模型,能够提前将业务用户关注的数据推送给业务用户,具有查询时间短、用户体验效果好的特点。
-
公开(公告)号:CN111091809B
公开(公告)日:2023-05-23
申请号:CN201911051663.5
申请日:2019-10-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G10L15/00 , G10L15/02 , G10L15/08 , G06F18/2411 , G06F18/214 , G06F18/25
Abstract: 本发明提供一种深度特征融合的地域性口音识别方法和装置,方法包括:提取待识别语音的瓶颈BN特征和滑动差分倒谱SDC特征;将瓶颈BN特征和滑动差分倒谱SDC特征输入预先训练后的支持向量机SVM分类器中,得到输出的待识别语音的语音类别。本发明采用多特征融合的语种识别系统,提取语音的深度特征,融合传统的SDC特征,输入SVM分类器,实现更鲁棒的语种识别功能,取得了对地域性方言普通话较好的分类效果。
-
-
-
-
-
-
-
-
-