-
公开(公告)号:CN106383817B
公开(公告)日:2019-07-02
申请号:CN201610866179.8
申请日:2016-09-29
Applicant: 北京理工大学
IPC: G06F17/27
Abstract: 本发明涉及一种利用分布式语义信息的论文标题生成方法,属于自然语言处理领域。本发明首先利用TextRank算法获取论文摘要的前k个关键词,训练GloVe模型得到词向量,对提取的关键词进行向量初始化,然后利用基于长短期记忆单元的循环神经网络标题生成模型获取标题,最后进行标题构建。本发明利用深度学习的方法挖掘标题的深层语义信息,使生成的标题可读性强,且符合标题的语义规则。
-
公开(公告)号:CN109948162A
公开(公告)日:2019-06-28
申请号:CN201910225744.6
申请日:2019-03-25
Applicant: 北京理工大学
Abstract: 本发明涉及融合序列语法标注框架的生成式文本摘要方法,属于自然语言处理领域。主要为了解决现有模型在产生摘要时没有考虑语法结构,因此生成的摘要存在不满足语法规则的问题。本发明首先利用开源句法分析器Berkeley Parser对句子进行成分句法分析,生成短语解析树;其次通过深度优先遍历算法,将短语解析树线性化成一个结构标签序列;然后使用word2vec工具对语法标注序列进行向量化;最后将源语法结构信息输入到编码器中,经过摘要生成模块编、解码,最终生成摘要。实验在CNN/Daily Mail数据集上进行,结果表明本发明不仅解决了超纲词、重复短语、主题不显著等问题,而且生成的摘要基本满足语法规则,可读性更强,与源文本语法更具有一致性,ROUGE得分比先进算法有一定提高。
-
公开(公告)号:CN108462717A
公开(公告)日:2018-08-28
申请号:CN201810249326.6
申请日:2018-03-21
Applicant: 北京理工大学
IPC: H04L29/06
Abstract: 本发明涉及基于规则匹配命中率和分布方差的防火墙规则集优化方法,属于计算机与信息科学技术领域。本发明首先对防火墙初始化规则集进行预处理,预处理的内容包括规则集异常检测、异常处理及规则合并,预处理之后得到不存在异常规则的最简防火墙规则集。然后实时收集一段时间防火墙日志,根据防火墙日志信息计算规则权重,规则权重计算分为三个部分,分别是规则匹配命中频率统计、规则命中时间分布统计和根据这两项统计数据计算的规则权重值。最后根据计算出来的规则权重值,对防火墙规则集进行重排序,将权重值较高的规则放在优先级更高的位置。本发明相较于常规的防火墙规则集优化算法,有更好的优化效果,能够使防火墙保持较高的数据包过滤率,并且具备较好的灵活性和可移植性。
-
公开(公告)号:CN107170442A
公开(公告)日:2017-09-15
申请号:CN201710331199.X
申请日:2017-05-11
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于自适应遗传算法的多参数优化方法。从应用场景的角度讲,属于音频事件识别技术领域;从技术实现的角度来讲,亦属于计算机科学与音频处理技术领域。首先,对数据进行预处理,提取音频训练样本的底层特征,生成特征向量,并使用AdaBoost算法训练音频事件识别模型;其次,将音频事件识别系统的底层特征提取层、特征向量生成层、模型训练层的多参数进行二进制级联编码;然后,设定参数优化适应度函数以及循环终止条件;最后,采用自适应遗传算法优化参数,逼近最优解。本发明所述方法,可以减少参数优化训练时间,提高音频事件识别系统的准确率,解决了音频事件识别系统难以实现多层次参数联合优化的问题。
-
公开(公告)号:CN107123432A
公开(公告)日:2017-09-01
申请号:CN201710334633.X
申请日:2017-05-12
Applicant: 北京理工大学
CPC classification number: G10L25/51 , G10L15/06 , G10L15/063 , G10L25/03 , G10L25/24 , G10L25/45 , G10L2015/0635
Abstract: 本发明涉及一种自匹配Top‑N音频事件识别信道自适应方法,从应用场景的角度讲,属于音频事件识别技术领域;从技术实现的角度来讲,亦属于计算机科学与音频处理技术领域。本发明首先进行数据预处理,预处理过程包括量化、采样、预加重和加窗,然后进行特征提取,也就是对所需音频底层特征参数进行抽取,之后进行特征向量生成,也就是对提取的特征帧序列按照段长和段移进行压缩得到段向量,接下来是特征映射,特征映射是将信道相关特征段向量映射为信道无关特征段向量的过程,特征映射FM模块可分为FM训练和FM使用两个部分,最后进行模型训练和识别。本发明可以解决不同k值信道模型下高斯分量个数Top‑N的选择性问题和覆盖信道信息不均匀的问题,为网络传输编码差异影响下的音频事件识别提供一种较好的信道自适应方法。
-
公开(公告)号:CN107085661A
公开(公告)日:2017-08-22
申请号:CN201710332116.9
申请日:2017-05-12
Applicant: 北京理工大学
IPC: G06F19/00
Abstract: 本发明涉及一种基于PageRank的老年人身体机能量化计算方法,属于生物医学技术领域。本发明首先利用协方差矩阵表示属性与属性的相关性,将其作为PageRank算法的输入,获得身体机能各维属性的权值,通过线性加权的方法获得老年人身体机能得分,并以百分制的形式予以反馈。最后利用单变量分析的方法,从性别、年龄、文化、居住地、月收入文化程度等多个方面验证身体机能得分的合理性。结果表明本发明能够有效地对老年人进行量化计算,为老年人身体机能的改善提供了依据。
-
公开(公告)号:CN103198211B
公开(公告)日:2017-02-22
申请号:CN201310074038.9
申请日:2013-03-08
Applicant: 北京理工大学
Abstract: 本发明涉及2型糖尿病发病危险因素对血糖影响的定量分析方法,属于生物信息处理及医学领域。本发明首先使用C4.5和EM聚类算法实现重要发病危险因素的选择;再根据性别和年龄对全体人群进行划分,进而利用BP神经网络算法对细化人群进行敏感度计算,最终通过敏感度实现多因素对血糖影响的定量分析。与现有大量统计学方法相比,本发明采用数据挖掘方法,在充分考虑多因素之间相互影响的同时,在细化人群中实现多因素对血糖影响的定量分析,大大提高了定量分析的准确率,并可为个体发病的细化干预提供判定方法。本发明可对个体2型糖尿病发病进行干预指导,不仅可以预防或延缓发病,而且该方法可应用推广到其它疾病危险因素的定量分析。
-
公开(公告)号:CN105808252A
公开(公告)日:2016-07-27
申请号:CN201610123820.9
申请日:2016-03-04
Applicant: 北京理工大学
IPC: G06F9/44
CPC classification number: G06F8/74
Abstract: 本发明涉及一种Windows操作系统内核函数遍历方法,属于计算机与信息科学技术领域。本发明首先找到操作系统中的函数起始点,包括:快速系统调用函数、系统服务描述符表中的函数、中断处理函数等函数地址等;然后以这些函数为起点向子函数遍历,搜索跳转指令和调用指令找到子函数及其对应的参数;循环递归以上操作,直到找不到子函数为止;最后结合符号表获取函数名。本发明可以对Windows操作系统的内核函数进行遍历,其方法也可以适用于其他操作系统。
-
公开(公告)号:CN103209173B
公开(公告)日:2016-07-13
申请号:CN201310075248.X
申请日:2013-03-08
Applicant: 北京理工大学
IPC: H04L29/06
Abstract: 本发明公开了一种针对网络协议的漏洞挖掘方法,其步骤包括:1构造一个具有特征码的正常数据并输入到目标客户端。2劫持系统调用,挂起目标客户端进程,记录特征数据的偏移位置。3对内存中的特征数据,进行动态变异。4继续执行目标客户端进程,使得变异后的特征数据通过目标客户端的发包流程,发送给目标服务端。5监测目标服务端状态,如果监测到异常状态,则记录异常和变异信息,并报告一个安全漏洞。与现有技术相比,本发明可以大大提高未知网络协议的漏洞挖掘效率。
-
公开(公告)号:CN105740238A
公开(公告)日:2016-07-06
申请号:CN201610124157.4
申请日:2016-03-04
Applicant: 北京理工大学
IPC: G06F17/27
CPC classification number: G06F17/2785 , G06F17/2745 , G06F17/2765
Abstract: 本发明涉及一种融合句义信息的事件关系强度图构建方法。首先基于汉语句义结构理论,提取句子语义信息,扩充事件的特征维度,并利用改进的TF?IDF方法完成事件向量表达,再结合上下文信息和核心事件信息优化事件向量,最后利用LDA方法获取事件之间关系强度,设定合适的关系强度阈值,构建事件关系强度图。本发明通过融合句义信息,提供了一种将孤立分散的事件以一种可度量形式关联起来的方法,并通过事件关系强度图直观展示事件间的关系,准确的定位核心事件,有力支撑后续基于事件关系的自动文摘、舆情预测等自然语言处理应用。
-
-
-
-
-
-
-
-
-