-
公开(公告)号:CN113420123B
公开(公告)日:2025-01-14
申请号:CN202110705729.9
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/3329 , G06F16/334 , G06F18/214 , G06N3/02
Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置,包括:获取训练样本集;训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签;复制语言模型得到教师语言模型,将语言模型作为学生语言模型;将第二任务标签输入至教师语言模型中,生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签;将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中,生成第一预测文本、第一预测结果、第二预测文本和第二预测结果,对学生语言模型进行训练。根据本申请实施例,能够解决相关技术中存储资源占用大的问题。
-
公开(公告)号:CN113420123A
公开(公告)日:2021-09-21
申请号:CN202110705729.9
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06K9/62 , G06N3/02
Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置,包括:获取训练样本集;训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签;复制语言模型得到教师语言模型,将语言模型作为学生语言模型;将第二任务标签输入至教师语言模型中,生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签;将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中,生成第一预测文本、第一预测结果、第二预测文本和第二预测结果,对学生语言模型进行训练。根据本申请实施例,能够解决相关技术中存储资源占用大的问题。
-
公开(公告)号:CN113420121A
公开(公告)日:2021-09-21
申请号:CN202110704938.1
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06K9/62
Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。根据本申请实施例,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。
-
公开(公告)号:CN113436619A
公开(公告)日:2021-09-24
申请号:CN202110594164.1
申请日:2021-05-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/06 , G10L15/08 , G10L19/18 , G10L25/18 , G10L25/24 , G10L25/27 , G10L25/30 , G10L25/45 , G10L25/54 , H04L9/32 , G10L15/14
Abstract: 本发明提供了一种语音识别解码的方法及装置。语音识别解码方法包括:确定待识别语音的N个子帧所对应的对数梅尔谱特征序列;通过经训练的神经网络编码器,处理所述对数梅尔谱特征序列,得到所述N个子帧各自对应的字符或者空白符的发射概率;根据预先确定的第一加权有限状态转移器以及所述N个子帧各自对应的的字符或者空白符的发射概率,采用束搜索算法搜索分数最高的词语序列。相比于传统的语音识别系统,本申请省略了帧级别对齐的流程,简化了训练和解码的流程;相比于端到端语音识别系统,在束搜索算法过程中使用加权有限状态转移器加快解码速度,高效地利用训练音频数据之外的文本数据,可以在多种领域快速部署语音识别系统。
-
公开(公告)号:CN113420121B
公开(公告)日:2023-07-28
申请号:CN202110704938.1
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06F18/214
Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。根据本申请实施例,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。
-
公开(公告)号:CN113436619B
公开(公告)日:2022-08-26
申请号:CN202110594164.1
申请日:2021-05-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/06 , G10L15/08 , G10L19/18 , G10L25/18 , G10L25/24 , G10L25/27 , G10L25/30 , G10L25/45 , G10L25/54 , H04L9/32 , G10L15/14
Abstract: 本发明提供了一种语音识别解码的方法及装置。语音识别解码方法包括:确定待识别语音的N个子帧所对应的对数梅尔谱特征序列;通过经训练的神经网络编码器,处理所述对数梅尔谱特征序列,得到所述N个子帧各自对应的字符或者空白符的发射概率;根据预先确定的第一加权有限状态转移器以及所述N个子帧各自对应的的字符或者空白符的发射概率,采用束搜索算法搜索分数最高的词语序列。相比于传统的语音识别系统,本申请省略了帧级别对齐的流程,简化了训练和解码的流程;相比于端到端语音识别系统,在束搜索算法过程中使用加权有限状态转移器加快解码速度,高效地利用训练音频数据之外的文本数据,可以在多种领域快速部署语音识别系统。
-
公开(公告)号:CN117496394A
公开(公告)日:2024-02-02
申请号:CN202311337406.4
申请日:2023-10-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V40/16 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/084 , G06N3/0464 , G10L25/57 , G10L25/30
Abstract: 本发明提供一种基于图像和语音多模态融合的伪造视频检测方法及装置,该方法涉及视频检测技术领域,包括:将待检测视频进行预处理,得到多个视频片段;待检测视频包括音频,每个视频片段包括音频;针对每个视频片段,分别提取视频片段的视频特征向量和视频片段中的音频的音频特征向量;基于各视频特征向量和各音频特征向量,确定待检测视频对应的总视频特征向量和总音频特征向量;基于各视频特征向量、各音频特征向量、总视频特征向量和总音频特征向量,确定待检测视频的目标检测结果;目标检测结果表示待检测视频为伪造视频或者真实视频,提升了待检测视频的目标检测结果的准确性,进而提升了对待检测视频中深度伪造内容的检测精度。
-
公开(公告)号:CN117035058A
公开(公告)日:2023-11-10
申请号:CN202310971765.9
申请日:2023-08-03
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明属于联邦学习领域,提供了一种基于联邦学习模型的训练方法,包括以下步骤:S11,定义问题:确定需要解决的机器学习问题、本地数据的来源、以及参与联邦学习的设备或节点;S12,模型选择和初始化:选择相应的模型,并在所有的本地设备或节点上初始化相应的模型,并下发至所有用户端;S13,本地训练:每个本地设备或节点使用其本地数据集对初始化的模型进行训练,得到一个本地模型;S14,模型聚合:在中央服务器上聚合本地模型;本发明通过在每个本地设备或节点都可以进行本地模型的训练和更新,进一步分散计算负载,提高训练速度和效率;通过设定停止条件来控制模型更新的频率,进而避免过度拟合等问题。
-
公开(公告)号:CN114915650B
公开(公告)日:2023-08-08
申请号:CN202210430295.0
申请日:2022-04-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L67/14 , H04L65/1104 , H04L65/65
Abstract: 本发明公开一种基于网元信息聚合的VoIP服务观测视角的判定方法及系统,涉及互联网语音传输服务领域,通过在单一观测点下对被动流量中VoIP网元信息进行聚合分析,进而判断其服务观测位置,可在全局观测点下提供各VoIP服务网元的相关信息,并为全局VoIP会话链路还原提供有效参考。
-
公开(公告)号:CN114936723B
公开(公告)日:2023-04-14
申请号:CN202210856300.4
申请日:2022-07-21
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及数据挖掘技术领域,公开了一种基于数据增强的社交网络用户属性预测方法及系统,该属性预测方法,基于用户的历史行为序列,推断用户未来一段时间的行为序列,通过将历史行为序列与预测得到的行为序列进行拼接,扩大行为序列的长度,对用户的行为数据进行增强。本发明解决了现有技术存在的在线网络用户行为序列长度较短时不能为用户属性预测任务提供足够信息、从而导致用户属性预测的预测准确性低的问题。
-
-
-
-
-
-
-
-
-