-
公开(公告)号:CN113420123A
公开(公告)日:2021-09-21
申请号:CN202110705729.9
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06K9/62 , G06N3/02
Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置,包括:获取训练样本集;训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签;复制语言模型得到教师语言模型,将语言模型作为学生语言模型;将第二任务标签输入至教师语言模型中,生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签;将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中,生成第一预测文本、第一预测结果、第二预测文本和第二预测结果,对学生语言模型进行训练。根据本申请实施例,能够解决相关技术中存储资源占用大的问题。
-
公开(公告)号:CN113420121A
公开(公告)日:2021-09-21
申请号:CN202110704938.1
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06K9/62
Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。根据本申请实施例,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。
-
公开(公告)号:CN113420112A
公开(公告)日:2021-09-21
申请号:CN202110685518.3
申请日:2021-06-21
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F40/289 , G06K9/62
Abstract: 本发明涉及一种基于无监督学习的新闻实体分析方法及装置。方法包括:对待处理的多条新闻数据中的每条新闻数据分别进行分词处理,将分词处理后的每条新闻中包含的多个实体进行标注以得到标注结果;基于所述标注结果构建分布式表示模型,得到所述多个实体的分布式表示信息,所述分布式表示信息标识为实体向量;根据所述多个实体的分布式表示信息,对所述多个实体进行聚类分析以得到聚类结果。本申请将分布式的思想引入新闻实体的处理当中,通过新闻实体所处位置的上下文来得到实体的分布式表示,通过对实体的聚类分析来得到实体的聚类结果。
-
公开(公告)号:CN110912766B
公开(公告)日:2021-04-20
申请号:CN201910991038.2
申请日:2019-10-18
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 杭州东信北邮信息技术有限公司
Abstract: 一种通讯网络多平面数据一致性校验方法,包括:业务平面装置对数据加密,并封装成数据消息,然后将数据消息下发至控制平面装置:控制平面装置从数据消息中提取数据路由规则,然后将数据消息分发到相应的接入平面装置;接入平面装置从控制平面装置发来的数据消息中逐一读取、并加载每条加密数据,当加载完所有数据后,计算已加载的数据条目数和数据校验和,将已加载的数据条目数和数据校验和、与从数据消息中提取的数据条目数量和数据校验和进行比对,当比对结果一致时,向业务平面装置返回数据加载成功结果消息。本发明属于信息技术领域,能基于当前的通讯网络管理架构,有效保障多平面之间的数据同步一致性,从而确保通讯网络的安全可靠。
-
公开(公告)号:CN112466310A
公开(公告)日:2021-03-09
申请号:CN202011105315.4
申请日:2020-10-15
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了深度学习声纹识别方法、装置、电子设备及存储介质,该方法包括:获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。本发明解决了传统声纹识别算法或者单纯数字密码验证的局限性,实现了较理想的密码验证准确率。
-
公开(公告)号:CN110798460A
公开(公告)日:2020-02-14
申请号:CN201911011306.6
申请日:2019-10-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L29/06
Abstract: 本发明公开了一种媒体网关检测方法、装置及可读存储介质,所述方法包括:调取会话的日志数据,并根据所述日志数据获取信令网关;根据所获取的信令网关对所述日志数据进行分组;根据分组后的日志数据提取信令网关对应的媒体网关。本发明实施例通过根据日志数据获取信令网关;根据所获取的信令网关对所述日志数据进行分组;根据分组后的日志数据提取信令网关对应的媒体网关。由此解决了现有技术对网络环境依赖较大,且检测范围不全的问题。
-
公开(公告)号:CN110784460A
公开(公告)日:2020-02-11
申请号:CN201911011321.0
申请日:2019-10-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种通话攻击检测方法、装置及可读存储介质,属于通信技术领域,获取发往各个终端的请求数量,并根据所述请求数量确定异常请求的统一资源标识符URI;从所述异常请求的URI提取高呼叫频率建立会话请求的URI以判定攻击者。本发明方法通过根据请求数量确定异常请求的统一资源标识符URI;从异常请求的URI提取高呼叫频率建立会话请求的URI以判定攻击者,由此解决了现有的存在的误报、漏报、检测率低的问题,取得了积极的技术效果。
-
公开(公告)号:CN110266902A
公开(公告)日:2019-09-20
申请号:CN201910444314.3
申请日:2019-05-27
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
Abstract: 本发明公开了一种VoIP信令与媒体数据关联系统、方法及计算机存储介质,系统包括识别过滤装置、解析处理装置、核心关联装置和数据分析反馈装置,方法上采用多维度数据对互联网VoIP网络电话协议信令与媒体数据进行关联。本发明从功能上,既保证了关联结果的高质量性,又保证关联结果的高数量性;从可靠性上,对关联结果的后续分析并将分析结果反馈给关联使用,逐步优化系统的关联效果;从可扩展性上,采用多装置处理的方式,使得需要拓展功能时,只需要修改或者扩展单装置功能而不影响整体的功能以及效果。
-
公开(公告)号:CN109460460A
公开(公告)日:2019-03-12
申请号:CN201811307870.8
申请日:2018-11-05
Applicant: 国家计算机网络与信息安全管理中心 , 武汉大学
IPC: G06F16/332 , G06F17/27 , G06N5/04
Abstract: 本发明公开了一种面向智能应用的领域本体构建方法,首先获取智能应用相关的多领域数据;明确并细化智能应用需求,构建面向本体的智能应用需求分析模型;定义本体中概念及其属性、各类型关系,创建实例,进行形式化编码;然后利用Jena实现基于领域本体的推理以补全缺失信息;接着运用多维量化指标评估本体的体系结构,判断是否返回以修正本体;最后评估本体对智能应用需求的支持程度,动态更新体系结构以响应应用需求的变化,直到所构建的本体能够满足应用需求。本发明采用循环式的开发结构,强调本体全生命周期内智能应用需求与跨领域本体构建的相互作用,适用于表示面向智能应用的跨领域知识关联,解决现有本体构建方法不足以支撑智能应用的问题。
-
公开(公告)号:CN108629412A
公开(公告)日:2018-10-09
申请号:CN201710152727.5
申请日:2017-03-15
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06N3/08
Abstract: 本发明提供了一种基于无网格最大互信息准则的神经网络训练加速方法,本发明的方法通过对无网格最大互信息准则(LFMMI准则)下的神经网络CE准则输出端进行低秩转换,将原有的高秩矩阵模块拆分为两个低秩矩阵模块,拆分后的两个低秩矩阵模块内的子阵相乘最后的维度和之前的全连接矩阵一致,在保证神经网络CE准则输出端总体维度不变的情况下,利用改造后的低维度子阵进行神经网络训练,从而简化了运算结构,使神经网络的输出层前向计算和后向计算占据训练时间比例明显减小,加快了神经网络的训练。
-
-
-
-
-
-
-
-
-