-
公开(公告)号:CN113420121B
公开(公告)日:2023-07-28
申请号:CN202110704938.1
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06F18/214
Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。根据本申请实施例,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。
-
公开(公告)号:CN110719592B
公开(公告)日:2023-01-31
申请号:CN201910992033.1
申请日:2019-10-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W12/128
Abstract: 一种兼容4G和5G网络的防范诈骗电话的系统与方法,包括:业务管理装置,将通话检测策略数据下发给汇聚装置,并接收汇聚装置上传的呼叫数据;汇聚装置,根据通话检测策略数据,从样本数据中提取特征信息,并加密,再将加密后的通话检测策略数据和特征信息发给各个前端接入装置;同时,将各个前端接入装置发来的呼叫数据还原后回传给业务管理装置;前端接入装置,根据收到的通话检测策略数据,对触发至核心网元的呼叫进行信令的实时解析,并将符合通话检测策略的呼叫数据回传给汇聚装置。本发明属于信息技术领域,能构建一套兼容4G并适配5G分组化、扁平化网络下的诈骗电话防范网络,保障不断演进的电信网络架构下的通信安全。
-
公开(公告)号:CN115083423B
公开(公告)日:2022-11-15
申请号:CN202210861979.6
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种语音鉴别的数据处理方法和装置,涉及语音识别技术、人工智能和计算机技术领域,上述数据处理方法包括:获取待鉴别音频;对上述待鉴别音频进行特征提取,得到初始声学特征;对上述初始声学特征进行量化处理,得到量化声学特征;将上述量化声学特征输入至目标语音鉴别模型中进行处理,输出得到上述待鉴别音频的真伪结果,上述目标语音鉴别模型为参数预训练好且经过量化后的语音鉴别模型。在确保语音真伪鉴别准确率的基础上能够提升语音真伪鉴别的鉴别速度,提升数据处理的效率。
-
公开(公告)号:CN115083421B
公开(公告)日:2022-11-15
申请号:CN202210859650.6
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种自动寻参的语音鉴别模型的构建方法及装置,能自动调整超参数至最优,该方法包括:获取训练集中的语音数据;基于预训练语音特征提取模型,对语音数据进行特征提取,得到语音特征;将语音特征输入至轻量化可微结构并作为初始节点,根据搜索空间预定义的候选操作进行网络结构搜索,得到包含所有候选分支路径和候选节点的候选网络结构;其中候选操作表征从前一节点到后一节点的网络连接关系;将语音数据为真伪语音的真实结果作为训练标签,在训练过程中对候选网络结构的节点之间候选操作对应的结构权重进行调整;根据训练完成的结构权重,对候选网络结构进行精简,得到目标网络结构;根据目标网络结构,生成语音鉴别模型。
-
公开(公告)号:CN115081437A
公开(公告)日:2022-09-20
申请号:CN202210855918.9
申请日:2022-07-20
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06F40/253 , G06F40/242 , G06F40/216 , G06F40/211 , G06F40/30 , G06F16/33
Abstract: 本发明涉及文本检测技术领域,公开了基于语言学特征对比学习的机器生成文本检测方法及系统,该机器生成文本检测方法,包括以下步骤:S1,预训练模型调整;S2,话语图构建;S3,向量表示计算;S4,文本检测参数更新。本发明解决了现有技术存在的在标注数据有限的情况下自动准确识别网络中的机器生成文本等问题。
-
公开(公告)号:CN113436619B
公开(公告)日:2022-08-26
申请号:CN202110594164.1
申请日:2021-05-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/06 , G10L15/08 , G10L19/18 , G10L25/18 , G10L25/24 , G10L25/27 , G10L25/30 , G10L25/45 , G10L25/54 , H04L9/32 , G10L15/14
Abstract: 本发明提供了一种语音识别解码的方法及装置。语音识别解码方法包括:确定待识别语音的N个子帧所对应的对数梅尔谱特征序列;通过经训练的神经网络编码器,处理所述对数梅尔谱特征序列,得到所述N个子帧各自对应的字符或者空白符的发射概率;根据预先确定的第一加权有限状态转移器以及所述N个子帧各自对应的的字符或者空白符的发射概率,采用束搜索算法搜索分数最高的词语序列。相比于传统的语音识别系统,本申请省略了帧级别对齐的流程,简化了训练和解码的流程;相比于端到端语音识别系统,在束搜索算法过程中使用加权有限状态转移器加快解码速度,高效地利用训练音频数据之外的文本数据,可以在多种领域快速部署语音识别系统。
-
公开(公告)号:CN113835387A
公开(公告)日:2021-12-24
申请号:CN202111089659.5
申请日:2021-09-16
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
IPC: G05B19/048 , H04Q9/00 , G07C1/20
Abstract: 本发明实施例公开了运维管理方法、系统及介质,其中方法包括以下步骤:基于数据采集接口收集业务数据和告警数据;基于告警预测模型得到预测业务数据;基于业务告警模型,对比所述预测业务数据和所述业务数据,若超过设定阈值则产生告警;基于告警自动匹配模型,根据所述告警数据进行标识恢复告警处理;基于巡检机器人采集环境特征数据,并根据所述环境特征数据确定是否告警。本发明实施例能够提高运维的效率。
-
公开(公告)号:CN113765556A
公开(公告)日:2021-12-07
申请号:CN202111134795.1
申请日:2021-09-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04B7/0456 , H04B7/0413 , H04B17/318 , H04L5/00 , H04L25/02 , H04W12/00
Abstract: 本公开提供一种数据传输方法、装置、电子设备及存储介质。该方法包括:接收合法用户发送的导频信号;根据所述导频信号进行信道估计,获得信道状态信息;对所述信道状态信息进行混合预编码,获得混合预编码矩阵;基于零空间的人工辅助噪声序列对所述信道状态信息进行预编码,获得人工噪声预编码矩阵;使用所述混合预编码矩阵和所述人工噪声预编码矩阵进行数据传输。该方法可以保证基站与合法用户间数据的安全传输。
-
公开(公告)号:CN109492026B
公开(公告)日:2021-11-09
申请号:CN201811301410.4
申请日:2018-11-02
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/2458 , G06Q50/30
Abstract: 本发明公开了一种基于改进的主动学习技术的电信欺诈分类检测方法,涉及一种基于改进的主动学习技术的电信欺诈分类检测方法。抽取数量为X的数据划分训练集和测试集。从训练集中抽取样本作为初始训练集,其余为未标记样本。若当前训练集中正类与负类样本数量的比值不小于阈值e,训练有监督分类器f并构造强组合分类器F;将未标记样本逐个放入有监督分类器f中进行类别评分,得到类别评分结果,输入主动学习采样算法,得到信息量大小的评分。选取信息量最大的前D个进行标注,并加入训练集中;当前训练集样本数量大于等于X1,或者迭代次数大于等于C时结束,输出训练好的分类器f。本发明具有较强的稳定性和鲁棒性,实现较高的分类和检测效率。
-
公开(公告)号:CN113286035A
公开(公告)日:2021-08-20
申请号:CN202110529065.5
申请日:2021-05-14
Applicant: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
Inventor: 刘发强 , 张震 , 石瑾 , 李鹏 , 刁则鸣 , 黄远 , 仇艺 , 张梦影 , 袁堂岭 , 尚程 , 阿曼太 , 梁彧 , 蔡琳 , 杨满智 , 王杰 , 田野 , 金红 , 陈晓光 , 傅强
Abstract: 本发明实施例公开了一种异常呼叫检测方法、装置、设备及介质。该方法包括:获取多种类型的通话记录描述数据;根据各通话记录描述数据形成至少一个多源数据分组,多源数据分组中包括至少两种类型的通话记录描述数据;将每个多源数据分组中包括的各通话记录描述数据进行关联分析,形成与每个多源数据分组分别对应的异常呼叫检测结果。在上述技术方案中,通过对多种类型的通话记录描述数据进行关联分析,得到异常呼叫检测结果,实现了有效地对异常呼叫进行安全监管,提高了异常呼叫的检测精确度。
-
-
-
-
-
-
-
-
-