-
公开(公告)号:CN108682418A
公开(公告)日:2018-10-19
申请号:CN201810669327.6
申请日:2018-06-26
Applicant: 北京理工大学
CPC classification number: G10L15/20 , G10L15/063 , G10L15/16 , G10L25/18 , G10L25/24 , G10L25/30 , G10L25/45
Abstract: 本发明公开了一种模型预训练和双向LSTM的语音识别方法,属于深度学习和语音识别领域。1)输入待处理语音信号;2)预处理;3)提取梅尔倒谱系数及动态差分得到语音特征;4)构建双向LSTM结构;5)使用maxout函数优化双向LSTM,得到maxout‑biLSTM;6)模型预训练;7)使用预训练后的maxout‑biLSTM对含噪声的语音信号进行训练,得到结果。本发明使用maxout激活函数改进了双向LSTM的原激活函数,并且使用了模型预训练的方法,提高了声学模型在噪声环境下的鲁棒性,可应用于高噪声环境下语音识别模型的构建与训练。
-
公开(公告)号:CN108682418B
公开(公告)日:2022-03-04
申请号:CN201810669327.6
申请日:2018-06-26
Applicant: 北京理工大学
Abstract: 本发明公开了一种模型预训练和双向LSTM的语音识别方法,属于深度学习和语音识别领域。1)输入待处理语音信号;2)预处理;3)提取梅尔倒谱系数及动态差分得到语音特征;4)构建双向LSTM结构;5)使用maxout函数优化双向LSTM,得到maxout‑biLSTM;6)模型预训练;7)使用预训练后的maxout‑biLSTM对含噪声的语音信号进行训练,得到结果。本发明使用maxout激活函数改进了双向LSTM的原激活函数,并且使用了模型预训练的方法,提高了声学模型在噪声环境下的鲁棒性,可应用于高噪声环境下语音识别模型的构建与训练。
-
公开(公告)号:CN109165159A
公开(公告)日:2019-01-08
申请号:CN201810906860.X
申请日:2018-08-10
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于程序频谱的多缺陷定位方法,属于软件安全技术领域。包括以下步骤:步骤一:构造待缺陷定位检测的程序频谱;步骤二:对多缺陷定位问题建模,即构建候选缺陷分布种群,具体为使用二进制序列表示步骤一得到的待缺陷定位检测的程序频谱;步骤三:使用遗传算法对步骤二构建的候选缺陷分布种群的解空间进行搜索,得到用于定位的最优种群;步骤四:对步骤三得到的最优种群中的候选缺陷个体的怀疑值排序,得出最终的怀疑值排名。本发明通过对多缺陷定位问题进行建模,并使用遗传算法得到函数怀疑值列表,能够对程序中的多缺陷同时定位;通过基于程序频谱的多缺陷定位方法以及遗传算法,有效提高了多缺陷的定位效率以及定位准确率。
-
公开(公告)号:CN109033833B
公开(公告)日:2021-04-09
申请号:CN201810766624.2
申请日:2018-07-13
Applicant: 北京理工大学
Abstract: 一种基于多特征与特征选择的恶意代码分类方法,属于计算机安全和机器学习技术领域。涉及一种通过融合恶意代码家族不同类别的特征得到多特征,并提出一种特征选择的方法处理多特征,具体通过融合像素特征以及n‑gram特征,得到表征恶意代码家族的多特征信息,通过使用L2正则项优化的带有L1正则项的逻辑回归模型对融合特征进行初步特征选择,然后使用线性判别分析对特征进行降维,最后使用K最近邻算法训练恶意代码分类器。本发明能够为训练过程提供更多维度的特征数据;能够解决关键特征无法被选取的问题;通过使用LDA进行特征降维,使映射后的样本具有更好的分类性能,不仅加快了训练速度,而且提高了模型的分类准确度。
-
公开(公告)号:CN109033833A
公开(公告)日:2018-12-18
申请号:CN201810766624.2
申请日:2018-07-13
Applicant: 北京理工大学
CPC classification number: G06F21/563 , G06K9/6223 , G06K9/6268 , G06K9/629
Abstract: 一种基于多特征与特征选择的恶意代码分类方法,属于计算机安全和机器学习技术领域。涉及一种通过融合恶意代码家族不同类别的特征得到多特征,并提出一种特征选择的方法处理多特征,具体通过融合像素特征以及n‑gram特征,得到表征恶意代码家族的多特征信息,通过使用L2正则项优化的带有L1正则项的逻辑回归模型对融合特征进行初步特征选择,然后使用线性判别分析对特征进行降维,最后使用K最近邻算法训练恶意代码分类器。本发明能够为训练过程提供更多维度的特征数据;能够解决关键特征无法被选取的问题;通过使用LDA进行特征降维,使映射后的样本具有更好的分类性能,不仅加快了训练速度,而且提高了模型的分类准确度。
-
公开(公告)号:CN109165159B
公开(公告)日:2021-10-01
申请号:CN201810906860.X
申请日:2018-08-10
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于程序频谱的多缺陷定位方法,属于软件安全技术领域。包括以下步骤:步骤一:构造待缺陷定位检测的程序频谱;步骤二:对多缺陷定位问题建模,即构建候选缺陷分布种群,具体为使用二进制序列表示步骤一得到的待缺陷定位检测的程序频谱;步骤三:使用遗传算法对步骤二构建的候选缺陷分布种群的解空间进行搜索,得到用于定位的最优种群;步骤四:对步骤三得到的最优种群中的候选缺陷个体的怀疑值排序,得出最终的怀疑值排名。本发明通过对多缺陷定位问题进行建模,并使用遗传算法得到函数怀疑值列表,能够对程序中的多缺陷同时定位;通过基于程序频谱的多缺陷定位方法以及遗传算法,有效提高了多缺陷的定位效率以及定位准确率。
-
-
-
-
-