-
公开(公告)号:CN117633233A
公开(公告)日:2024-03-01
申请号:CN202311669996.0
申请日:2023-12-07
Applicant: 北京理工大学
IPC: G06F16/35 , G06F18/213 , G06F18/2415 , G06F18/25 , G06Q50/00 , G06N3/042 , G06N3/045 , G06N3/0464
Abstract: 本发明涉及利用双曲图网络的时序观点挖掘方法,属于自然语言处理与机器学习领域。本发明首先基于推文数据集生成社交关系图,利用指数映射将社交关系图嵌入双曲空间,通过双曲图卷积提取其结构特征;然后利用交叉注意力机制计算推文内容与推文时间的相关性,再结合时间注意力机制拟合早期推文对当前观点的影响权重,得到推文时序特征;最后拼接结构特征与时序特征得到推文的最终表示,输入分类器预测观点类别。本发明针对现有社交网络的观点挖掘方法未充分利用热门推文与相关推文间关系、难以准确建模早期推文对当前观点影响的问题,提出利用双曲图网络的时序观点挖掘方法,提升观点挖掘的准确率。
-
公开(公告)号:CN117475180A
公开(公告)日:2024-01-30
申请号:CN202311662098.2
申请日:2023-12-06
Applicant: 北京理工大学
IPC: G06V10/74 , G06V10/774 , G06V10/776 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及利用超图孪生神经网络的二进制函数相似性检测方法,属于计算机与信息科学技术领域。本发明首先基于二进制函数的抽象语法树构建包含数据流和控制流超边的有向异构超图;然后使用改进的超图孪生网络得到超图嵌入向量,并计算余弦距离作为函数对相似性度量,通过多层卷积有效学习远距离语句的结构和语义特征,利用初始残差连接与恒等映射保留语句初始特征并避免网络层数堆叠带来的性能下降;最后将该相似性度量与阈值进行比较来判别函数对是否相似。本发明针对现有方法未生成充分表示函数语义和结构的信息表征、难以准确建模函数内部远距离语句间相互影响的问题,提出利用超图孪生神经网络的二进制函数相似性检测方法,提升了检测准确率。
-
公开(公告)号:CN117474038A
公开(公告)日:2024-01-30
申请号:CN202311666479.8
申请日:2023-12-06
Applicant: 北京理工大学
Abstract: 本发明涉及利用神经元组合路径的深度学习模型测试样本生成方法,属于深度学习测试领域。本发明首先将训练集中所有样本按类别输入待测模型,在模型各层选取平均输出值最高的n个神经元,构建各类别对应的神经元组合路径;其次将种子样本输入模型,计算模型神经元与种子样本所属类别神经元组合路径之间的输出值差异;然后以最大化该差异为优化目标,通过梯度上升算法生成新测试样本;最后判断测试样本是否符合保留条件。本发明针对现有测试样本生成方法忽略了样本类别特征和神经元输出之间的关联性问题,构建了不同类别对应的神经元组合路径,使种子样本偏离其所在的神经元组合路径,从而生成特征分布更多样的测试样本。
-
公开(公告)号:CN116934562A
公开(公告)日:2023-10-24
申请号:CN202310505002.5
申请日:2023-05-06
Applicant: 北京理工大学
IPC: G06T1/00 , G06V10/74 , G06V40/18 , G06V10/776 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及融合虹膜信息和随机样本的深度学习模型水印保护方法,属于计算机与信息科学领域。本发明首先提取模型所有者的虹膜信息,并对模型训练集随机采样三次得到三组随机样本;其次利用哈夫曼树算法结合所有者虹膜信息和第一组随机样本生成水印样本;然后利用非下采样剪切波变换和拉普拉斯金字塔算法,融合水印样本和第二组随机样本得到触发样本;最后将触发样本与第三组随机样本合并构成新的数据集,利用该数据集训练原模型得到微调后的深度神经网络水印模型。本发明针对现有触发样本选取方式固定的问题,提出了一种融合虹膜信息和随机样本的深度学习模型水印保护方法,提升了模型水印的抗攻击性。
-
公开(公告)号:CN116204193A
公开(公告)日:2023-06-02
申请号:CN202310123840.6
申请日:2023-02-16
Applicant: 北京理工大学
IPC: G06F8/41 , G06F18/2415 , G06F18/214 , G06F18/21 , G06N3/04 , G06N3/08
Abstract: 本发明涉及强化指令执行语义的二进制函数相似性检测方法,属于网络安全技术领域。本发明首先通过IDA获取二进制函数的汇编代码基本块;其次利用Word2vec提取基本块的指令特征,同时根据执行语义表对基本块中的特定指令进行标注,并按照执行顺序生成指令执行语义表示序列;然后将指令特征及指令执行语义表示融合生成基本块嵌入,再基于基本块嵌入利用图嵌入网络生成二进制函数嵌入;最后利用孪生网络进行二进制函数相似性检测。本发明针对现有基本块嵌入生成方法未充分利用指令执行语义的问题,提出了一种基本块指令执行语义表示方法,强化指令执行语义特征,提升二进制函数相似性检测的准确率。
-
公开(公告)号:CN112199613B
公开(公告)日:2023-03-03
申请号:CN202011099728.6
申请日:2020-10-13
Applicant: 北京理工大学
IPC: G06F16/955 , G06F16/951 , G06F40/14 , G06F16/35
Abstract: 本发明涉及融合DOM拓扑和文本属性的产品URL自动定位方法,属于计算机与信息科学技术领域。本发明首先将网站转成DOM解析树结构,获取DOM解析树下各节点的文本属性并给节点添加标签属性;然后通过递归遍历DOM标签树,构建出节点带有产品标签属性的树形图,将树形图转换为包含DOM解析树拓扑结构的节点向量集w;并通过doc2vec将各节点下的文本属性转换成文本向量h;最后用学习到的融合DOM拓扑信息的节点向量、文本向量[w,h]结合标签属性,训练节点分类模型,完成URL自动定位。本发明融合DOM拓扑、文本属性,在现有方法的基础上自动学习页面的提取规则,提高方法的自适应能力,有效的解决了现有方法鲁棒性差、准确率低、工作量大的缺点,具有较高的实用价值和社会价值。
-
公开(公告)号:CN115062402A
公开(公告)日:2022-09-16
申请号:CN202210536133.5
申请日:2022-05-17
Applicant: 北京理工大学
IPC: G06F30/15 , G06F30/27 , G06F119/10
Abstract: 本发明涉及数据驱动的列车级位加速度提取方法,属于计算机与信息科学技术领域。本发明首先利用噪声与正常样本在训练过程中的不同损失变化模式,优化样本学习顺序。然后将自采样学习分别引入AdaBoost和梯度提升学习提出SSAdaBoost和SSGB稳健学习方法,建立目标列车性能估计模型,挖掘含噪运行数据中的专车性能知识,拟合加速度与速度、级位序列(隐含延时特性)、坡度等特征间的映射函数。最后利用“查询样本”控制级位序列、延时等特征影响,建立性能表,实现对目标特征与标签间量化关系抽取。弥补了现有方法推荐速度的跟踪难度大,控车级位频繁切换产生额外能耗问题。抽取性能与实际性能相似,可用于建立与受控列车匹配的性能约束,提升推荐速度优化效果。
-
公开(公告)号:CN115062103A
公开(公告)日:2022-09-16
申请号:CN202210534825.6
申请日:2022-05-17
Applicant: 北京理工大学
Abstract: 本发明涉及结合聚类与图注意力机制的多粒度语义融合文本匹配方法,属于自然语言处理与机器学习领域。本发明首先对实体、句子和主题三种不同粒度的语义信息分别建模得到相应的嵌入向量,实体和主题建模过程中引入外部语义知识;然后分别聚类实体、主题嵌入向量,使用聚类中心作为所在聚类中所有向量的统一表示;接着,利用图注意力机制学习句子级语义与实体、主题级语义之间的关联权重;最后,将训练后的句子向量作为句子的最终表示,进一步进行文本匹配任务。本发明能够有效提高特定领域短文本句子对的匹配效果,在一定程度上解决了待匹配文本过短且包含特定领域词汇导致语义稀疏,匹配准确率低的问题。
-
公开(公告)号:CN115056829A
公开(公告)日:2022-09-16
申请号:CN202210533015.9
申请日:2022-05-16
Applicant: 北京理工大学
Abstract: 本发明涉及多车型连续学习的列车运动状态估计方法,属于计算机与人工智能技术领域。首先通过特征抽取方法确定列车运行数据的基础特征集合,针对每一特征的样本关系构建单层图结构,根据特征关联关系组合单层图为多重图;其次,基于神经气体网络学习多重图的拓扑结构,并使用多车型运行数据对拓扑结构迭代更新;然后,对多重图的层内与层间关系进行数据聚合,并根据多车型知识拓扑结构生成样本的关系编码;最后,通过非线性变换组合基础特征,并与样本的关系编码结合,用于预测列车的运动状态。本发明将单一车型运行数据与多车型知识拓扑相结合,实现在真实运行数据有限的条件下多车型运行数据的连续建模与运动状态估计。
-
公开(公告)号:CN115048527A
公开(公告)日:2022-09-13
申请号:CN202210537384.5
申请日:2022-05-17
Applicant: 北京理工大学
IPC: G06F16/36 , G06F16/901 , G06F40/295
Abstract: 本发明涉及融合动态知识和事理逻辑的列车故障分析决策方法,属于自然语言处理和机器学习领域,本发明首先提取列车故障现象描述文本中的故障事件,融合时序动态知识和事理逻辑关系构建知识图谱;然后利用结合多头注意力机制的图转换网络对知识图谱进行编码,生成知识图谱的优先级向量表示;最后用一个结合注意力机制的解码器,根据编码结果从提前构建的解决方案词表中选取关键操作序列形成解决方案。由于本发明增加了对故障事件时序动态知识和事理逻辑关系的建模,提升了针对故障现象所分析生成解决方案的有效性和准确性。
-
-
-
-
-
-
-
-
-