-
公开(公告)号:CN116092512A
公开(公告)日:2023-05-09
申请号:CN202211740126.3
申请日:2022-12-30
Applicant: 重庆邮电大学
IPC: G10L21/0272 , G10L17/04 , G10L17/18
Abstract: 本发明涉及一种基于数据生成的小样本语音分离方法,属于语音分离领域,包括以下步骤:S1:采集并构建待分离语音数据集和目标说话人干净语音数据集;S2:对数据集进行预处理;S3:利用基于LSTM的语音匹配模型对预处理后的待分离语音数据集中的每段语音进行帧级别的目标说话人匹配,根据匹配结果,将语音段判断为:不含目标说话人、只包含一个目标说话人、包含多个目标说话人;S4:利用基于GAN的包含多个目标说话人的语音生成模型扩充待分离语音段;S5:构建并训练基于TCN的语音分离模型,将待分离的包含多个目标说话人的语音分离得到单一目标说话人的语音数据,最后拼接出单一说话人的完整语音。
-
公开(公告)号:CN118409787A
公开(公告)日:2024-07-30
申请号:CN202310424626.4
申请日:2023-04-19
Applicant: 重庆邮电大学
IPC: G06F8/75 , G06F18/22 , G06F18/214 , G06N3/0442 , G06N3/08
Abstract: 本发明涉及代码克隆检测技术领域,具体涉及一种利用结构信息的二进制代码克隆检测方法和系统;所述方法包括获取软件程序,进行反编译得到二进制代码指令序列,并对二进制代码指令序列提取出基本块和基本块间的结构信息;对二进制代码指令序列、基本块分别进行预处理;对预处理后的二进制代码指令序列和基本块中的各个指令通过预先训练好的词向量模型表征为词向量,得到词向量序列;将词向量序列和结构信息输入到预先训练好的深度学习模型中,提取出语义特征向量;计算出目标软件程序的语义特征向量与其他软件程序的语义特征向量间的相似度距离,根据相似度距离判断所述目标软件程序是否为代码克隆。本发明能够充分检测出软件代码是否为克隆代码。
-