-
公开(公告)号:CN119311871A
公开(公告)日:2025-01-14
申请号:CN202411222450.5
申请日:2024-09-02
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/36 , G06F18/25 , G06F18/213 , G06N3/045
Abstract: 本申请涉及舆情监测技术领域,公开一种面向噪声文本信息的检测方法及系统,所述方法包括:获取目标数据集;对目标数据集进行预处理,获取预处理后的文本特征;构成汉化文本分类模型预训练模型,其中,汉化文本分类模型预训练模型用于预处理后的文本特征,以获取文本的表示向量;构建两个结构不同的基于汉化文本分类预训练模型作为双塔模型的基分类器A和基分类器B;用相同数据集对基分类器A和基分类器B进行调整。本发明能够对双塔模型进行相互校验,对双塔模型的输出结果进行综合考量,并输出最终结果,从而有效提高整体的特定内容检测准确率。
-
公开(公告)号:CN113779961B
公开(公告)日:2024-10-01
申请号:CN202010518026.0
申请日:2020-06-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/253 , G06F40/289
Abstract: 本发明提供一种自然语言文本的惯用句式提取方法及电子装置,包括:对采集到的每一语句进行分词、词性标注及依存句法分析;将各语句转换为若干单句,并依据词性标注结果与依存句法分析结果,对各单句主干进行抽取,将各单句表示为词汇和词性标签的列表;将各单句的列表进行合并,得到各语句的惯用句式。本发明提出一种不损失句式信息的长难句化简方法,针对句式提取的需要对中文长难句中非句子主干部分进行处理,提高句式提取准确度,本发明还提出一种句式信息表示结构,使用词汇、词汇候选集、词性标签来表示句式信息,保留尽可能多的句式信息。
-
公开(公告)号:CN112331181B
公开(公告)日:2024-07-05
申请号:CN201910694870.6
申请日:2019-07-30
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于目标语音提取和自适应技术领域,具体涉及一种基于多说话人条件下目标说话人语音提取方法,该方法具体包括:实时获取多个说话人混合的语音,提取多个说话人混合的语音的频谱;将锚语音输入到预先训练的说话人识别模型中,提取出目标说话人的特征向量;将获取的多个说话人混合的语音的频谱和目标说话人的特征向量输入至预先训练的目标说话人语音提取网络中,获取目标说话人的语音频谱;基于该目标说话人的语音频谱,获取目标说话人的语音。
-
公开(公告)号:CN117295072A
公开(公告)日:2023-12-26
申请号:CN202210694396.9
申请日:2022-06-16
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: H04W12/67 , H04W12/03 , H04W12/122 , H04W24/08 , H04W24/10 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种5G网络中OTT语音业务风险管控策略的生成方法及装置,包括:分析OTT语音业务流量,生成异常OTT语音业务流量或用户行为的检测结果报告;根据所述检测结果报告与预置的OTT语音业务风险情报知识进行风险评估,OTT业务流量风险评估功能生成应急异常OTT语音业务或异常用户行为的风险等级,并依据所述风险等级,生成应急处置建议;基于应急处置建议,策略控制功能生成OTT语音业务风险管控策略。本发明引入新的流量风险评估功能实现对有害加密OTT语音业务、用户行为的风险评估,并结合5G策略控制体系实现有害OTT业务的应急处置。
-
公开(公告)号:CN113326689B
公开(公告)日:2023-08-18
申请号:CN202010128327.2
申请日:2020-02-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/205 , G06F40/211 , G06F18/214 , G06F18/2415 , G06N3/045 , G06N3/092
Abstract: 本发明属于数据通信和数据处理技术领域,具体涉及一种基于深度强化学习模型的数据清洗方法,该方法包括:获取待清洗的带标签的数据集;采用预筛选算法,删除待清洗的带标签的数据集中的无内容数据、不在标签集内的标签数据和标签矛盾的数据,获得待分类的数据集;将待分类的数据集输入至预先训练的深度强化学习模型中,获得不同类别的延迟奖励;再根据获得的不同类别的延迟奖励,依据预先训练的深度强化学习模型中的动作集合,丢弃掉有偏数据,保留有效数据,并更新状态列表S,最大化每一类别的延迟奖励值,将每一类别的最大延迟奖励值对应的带标签的训练数据集作为清洗干净的带标签的训练数据集,从而完成数据清洗。
-
公开(公告)号:CN115828277A
公开(公告)日:2023-03-21
申请号:CN202211327183.9
申请日:2022-10-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请提供一种数据预测方法、装置、电子设备及存储介质。该方法包括:获取原始明文数据和待预测明文数据;利用根据全同态加密技术得到的公钥对原始明文数据加密以确定原始密文数据,并利用公钥对待预测明文数据加密以确定待预测密文数据;利用原始密文数据训练得到预测模型;根据预测模型对待预测密文数据进行预测以确定预测密文数据;利用根据全同态加密技术得到的私钥对预测密文数据进行解密以确定预测明文数据。本申请全过程中的数据均通过全同态加密技术进行加密,在神经网络模型的训练以及数据预测过程中都可以有效的保证用户的隐私数据不被泄露,为数据安全性提供了保障。
-
公开(公告)号:CN115525758A
公开(公告)日:2022-12-27
申请号:CN202210628092.2
申请日:2022-06-06
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于SVM的特定文本大数据分析方法及系统,所述一种基于SVM的特定文本大数据分析方法包括:利用历史特定文本大数据得到历史特定文本大数据特征;利用所述历史特定文本大数据特征获取历史特定文本大数据分析结果,采用SVM的大数据分析系统的技术,全面提高特定文本的分类的准确性和覆盖率,通过在海量数据中实现对特定内容的精准分类,大大提高了特定内容分类的及时性和准确性,从而提高了系统层面对特定内容处理的流转环节,大大提高了应用系统的处理能力。
-
公开(公告)号:CN115238703A
公开(公告)日:2022-10-25
申请号:CN202210616914.5
申请日:2022-06-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/35 , G06N20/00
Abstract: 本发明涉及一种包含历史深度语义特定文本的识别方法及系统,所述一种包含历史深度语义特定文本的识别方法包括:利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始数据;利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果,通过大数据分析特定文本进行模型训练,并对特定内容的语义特征进行分析筛除,进而进行分类、识别及定性,提升了对于特定文本的识别准确率,避免误差的产生。
-
公开(公告)号:CN106791220B
公开(公告)日:2021-06-04
申请号:CN201611082262.2
申请日:2016-11-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W12/128 , H04M3/436 , H04M3/22 , H04M1/57
Abstract: 本发明公开了一种防止电话诈骗的方法及系统,其中,所述方法包括:获取实时话单;提取所述实时话单的号码特征和/或行为特征;根据预设的诈骗电话识别模型对所述实时话单的号码特征和/或行为特征进行分析,以确定所述实时话单对应的通话行为是否为诈骗电话;若确认所述实时话单对应的通话行为是诈骗电话,则向所述实时话单中的被叫号码发送报警提示,并将本次诈骗电话识别结果发送到第三方管理系统。本发明能够准确定位诈骗电话,及时获知诈骗电话的发生,并及时向诈骗电话对应的被叫号码发送报警提示,有效提高了用户对骚扰、诈骗电话的防控能力。
-
公开(公告)号:CN106686264B
公开(公告)日:2021-03-02
申请号:CN201610965273.9
申请日:2016-11-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04M3/436
Abstract: 本发明属于电信中有害电话监控技术领域,尤其是涉及一种诈骗电话筛选分析方法及系统。本发明的系统利用诈骗电话分析模型对历史数据进行分析,确定模型各特征权重值;对实时数据进行分析检测,检测结果与设定阈值比较给出诈骗电话的置信度。整个系统由数据查询管理系统、实时检测系统、模型自学习系统、趋势预测系统、数据存储系统组成。数据查询管理系统提供全量话单查询、诈骗话单查询、模型参数管理、自学习管理、趋势预测分析功能。实时检测系统通过诈骗电话发现模型实时分析、检测话单数据,发现诈骗电话。模型自学习系统对历史话单数据分析,通过自学习算法不断优化模型参数。趋势预测系统提供对未来诈骗电话趋势和变化进行预测。数据存储系统采用分布式存储系统,大数据分析处理引擎为整个系统提供快速数据抓取、数据分发、数据查询功能。
-
-
-
-
-
-
-
-
-