-
公开(公告)号:CN106941007A
公开(公告)日:2017-07-11
申请号:CN201710334631.0
申请日:2017-05-12
Applicant: 北京理工大学
CPC classification number: G10L25/03 , G10L15/06 , G10L15/063 , G10L25/45 , G10L25/51
Abstract: 本发明涉及一种音频事件模型合成信道自适应方法,属于计算机与信息科学技术领域。本发明首先对待识别音频进行预处理和特征提取,包括对音频的量化采样、预加重和加窗,并对音频的底层特征参数进行提取和特征帧序列切分,得到音频特征段向量;然后进行音频事件模型合成训练,构建通用背景模型及音频事件原始模型;最后进行音频事件模型合成使用,选择性的对音频事件模型进行自适应,并完成事件判定和识别。本发明在不同信道失配情况下,均可明显提升音频事件识别性能,自适应后的识别准确率和召回率接近信道匹配情况,有效实现了模型域信道自适应。
-
公开(公告)号:CN106445920A
公开(公告)日:2017-02-22
申请号:CN201610867254.2
申请日:2016-09-29
Applicant: 北京理工大学
CPC classification number: G06F17/271 , G06F17/2785 , G06K9/6215
Abstract: 本发明为解决社交短文本句子相似度计算的特征稀疏问题,提出利用句义结构特征的句子相似度计算方法。首先基于句义结构模型分析句子语义,并利用主题模型挖掘潜在的主题知识,根据主题-词语分布扩充句子特征,得到基于句子本身特征的句子向量,然后引入Paragraph Vector深度学习模型学习句子上下文特征,得到基于上下文信息的句子向量,最后加权由两种句子向量计算得到的句子相似度。本发明通过深度挖掘句子的语义信息和上下文信息,更加全面、准确地刻画了句子之间的内在联系,提高了相似度计算的准确率。
-
公开(公告)号:CN105573985A
公开(公告)日:2016-05-11
申请号:CN201610124099.5
申请日:2016-03-04
Applicant: 北京理工大学
IPC: G06F17/27
CPC classification number: G06F17/2705 , G06F17/2785
Abstract: 本发明涉及一种基于汉语句义结构模型和主题模型的句子表示方法,属于计算机科学与自然语言处理中文分析技术领域。本发明首先对句子进行句义结构分析,得到句子的句义结构;进而提取句子中的基本项词语和一般项词语,使用主题模型分析得到基本项知识库和一般项知识库;最终根据句义结构中话题和述题下词语,使用上一步分析得到的知识库对句子内容进行扩充,得到句子表示结果。本发明为为解决句子表示的特征稀疏问题提供了新的思路,并有效提升了句子的分类效果,具有重要的理论价值和实践作用。
-
公开(公告)号:CN103177722B
公开(公告)日:2016-04-20
申请号:CN201310074868.1
申请日:2013-03-08
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于音色相似度的歌曲检索方法,针对基于内容的音乐检索技术,综合利用歌曲背景音乐音色、歌唱者声音特点等特征,提出了一种基于MFCC和GMM的歌曲个性建模、计算和检索匹配的方法并加以实现,实验结果表明,该系统的检索速度快,系统稳定性高、可扩展性强。本发明特别适合对于音色要求较高的音频检索场合,例如器乐音频检索系统、多媒体音频管理系统等。
-
公开(公告)号:CN103150303B
公开(公告)日:2016-01-20
申请号:CN201310074015.8
申请日:2013-03-08
Applicant: 北京理工大学
IPC: G06F17/27
Abstract: 本发明涉及一种基于词法、句法和句义结构特征的汉语语义格分层识别方法,属于计算机科学与自然语言处理技术领域。本发明在增加了句义结构特征的基础上,首先获取最小完整语义单元;进而提取词法、句法和句义结构特征并使用C4.5决策树算法进行汉语语义格的初步识别;然后选择词法、句法和句义特征并使用C4.5决策树算法与最大熵算法相结合的方法实现汉语语义格中基本格的精确识别;最后再次选择词法、句法和句义特征并使用C4.5决策树算法实现汉语语义格中一般格的精确识别。与现有语言分析技术相比,本发明为语义学自动分析自然语言提供了汉语语义格的自动识别,是实现自动语义分析的基础。本发明可实现并行处理,能够提高计算机处理效率。
-
公开(公告)号:CN103150508B
公开(公告)日:2015-10-21
申请号:CN201310075013.0
申请日:2013-03-08
Applicant: 北京理工大学
IPC: G06F21/56
Abstract: 本发明涉及一种基于多维交叉视图的rootkit行为辨识方法,属于计算机与信息科学技术领域。本发明首先利用多种rootkit检测方法对操作系统进行检测,构造相应维数的检测视图,每一维视图代表相应的检测结果;若某几维视图未出现检测项而在其他所有视图中都出现了检测项,说明rootkit针对这几种检测方法采用了相应的规避手段(即隐藏方法);然后通过获悉的规避手段确定rootkit的污染数据是否可以被恢复,对可以恢复的污染数据进行恢复操作;最后重新对操作系统进行检测,确保污染数据被成功恢复。本发明可以对rootkit的具体行为和隐藏方法进行识别,不仅适用于桌面计算机的各种操作系统,也适用于手机、平板电脑等移动计算平台系统。
-
公开(公告)号:CN103150508A
公开(公告)日:2013-06-12
申请号:CN201310075013.0
申请日:2013-03-08
Applicant: 北京理工大学
IPC: G06F21/56
Abstract: 本发明涉及一种基于多维交叉视图的rootkit行为辨识方法,属于计算机与信息科学技术领域。本发明首先利用多种rootkit检测方法对操作系统进行检测,构造相应维数的检测视图,每一维视图代表相应的检测结果;若某几维视图未出现检测项而在其他所有视图中都出现了检测项,说明rootkit针对这几种检测方法采用了相应的规避手段(即隐藏方法);然后通过获悉的规避手段确定rootkit的污染数据是否可以被恢复,对可以恢复的污染数据进行恢复操作;最后重新对操作系统进行检测,确保污染数据被成功恢复。本发明可以对rootkit的具体行为和隐藏方法进行识别,不仅适用于桌面计算机的各种操作系统,也适用于手机、平板电脑等移动计算平台系统。
-
公开(公告)号:CN103150381A
公开(公告)日:2013-06-12
申请号:CN201310080760.3
申请日:2013-03-14
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于规则和统计相结合的谓词识别方法,属于自然语言处理与机器学习领域,目的是为解决谓词高精度高效率识别问题。本发明采用分步识别方法,从已进行词法和句法标注的句子中识别谓词,首先对待测句子进行词法分析,得到可疑谓词及其个数;接着利用初步识别判定条件进行谓词初步识别;对不满足初步识别判定条件的可疑谓词提取相关词法和句法特征并利用C4.5训练得到的决策树判定模型对其进行判定;最终汇总两步识别结果给出每个待测句子中的谓词。本发明具有准确率高、识别速度快、对非动词性谓词识别率高等特点,适用于要求高精度的汉语谓词识别领域,对句义分析的发展具有很大的推动作用,具有很好的应用价值和推广价值。
-
-
公开(公告)号:CN116257845B
公开(公告)日:2025-04-18
申请号:CN202310173239.8
申请日:2023-02-16
Applicant: 北京理工大学
IPC: G06F21/55 , G06F18/2415 , G06F18/25 , G06F18/22 , G06F16/2458 , G06N3/0442 , G06N3/0464
Abstract: 本发明涉及融合查询行为特征的分类模型窃取检测方法,属于计算机与信息科学领域。本发明首先从原始流量数据包中提取查询行为数据流,并基于查询行为数据流提取查询样本;然后对查询样本进行正态分布校验计算样本特征恶意值,同时利用CNN和LSTM提取查询行为数据流的时空特征,再判断查询行为类型并计算行为恶意值;最后结合样本特征恶意值和行为恶意值进行分类模型窃取检测。本发明针对攻击者生成的恶意查询样本与良性查询样本间的特征差异不明显的问题,提出了一种融合查询行为特征的分类模型窃取检测方法,提高了分类模型窃取检测召回率。
-
-
-
-
-
-
-
-
-