强化关联度计算的小样本用户多意图识别方法

    公开(公告)号:CN115757714A

    公开(公告)日:2023-03-07

    申请号:CN202211331155.4

    申请日:2022-10-28

    Abstract: 本发明涉及一种强化关联度计算的小样本用户多意图识别方法,属于自然语言处理领域。本发明旨在为用户对话样本标定多个意图标签,首先,利用BERT提取用户对话样本及其对应标签的嵌入表示;其次,计算支持集中标签与样本的关联度以增强标签原型表示,利用标签原型和查询样本构建原型网络;然后,计算多个领域的通用阈值和小样本领域的特定阈值,并以其他领域样本与查询样本的关联度均值为系数计算原型网络阈值;最后,根据原型网络阈值筛选出查询样本对应的多个意图标签。本发明提出强化关联度计算方法,同时考虑嵌入表示的特征值差异和特征维度差异,进一步降低标签间的干扰,并改进原型网络阈值计算方法,有效提升多意图识别任务的准确率。

    基于LightGBM的关键信息基础设施类型单位归属判定方法

    公开(公告)号:CN110334904B

    公开(公告)日:2023-03-03

    申请号:CN201910459822.9

    申请日:2019-05-30

    Abstract: 本发明涉及基于LightGBM的关键信息基础设施类型单位归属判定方法,属于网络空间安全与机器学习领域。主要为了解决传统的依赖人力对关键信息基础设施类型进行标注的效率低、可扩展性差的问题。本发明提出一种基于机器学习算法,结合多类型、多截面数据采集及特征表达的关键信息基础设施资产特征优化表达与多目标分类技术研究方法,在此基础上构建关键信息基础设施类型归属判别应用系统,根据设施资产数据判定其属于哪一类的关键信息基础设施(如政府机关、国防科工、广播电台、运营商等等),实现对关键信息基础设施类型归属的识别认定。实验结果表明,本发明提出的算法的准确率和查全率较好,与规则匹配方法相比,具有很好的判定效果。

    融合影响因子的二进制函数相似性检测方法

    公开(公告)号:CN113240041B

    公开(公告)日:2022-11-08

    申请号:CN202110607066.7

    申请日:2021-05-28

    Abstract: 本发明涉及融合影响因子的二进制函数相似性检测方法,属于网络安全技术领域。主要为了解决基于图嵌入的二进制函数相似性检测方法中由于忽略后继结点和邻居结点对于顶点的不同影响而导致的信息损失问题。本发明首先对两个二进制函数进行预处理,得到两个二进制函数的控制流程图(CFG1,CFG2);然后对CFG中的每个基本块进行特征提取,将其表示成特征向量,生成对应的属性控制流图(ACFG1,ACFG2);接下来将两个函数的属性控制流程图ACFG1,ACFG2输入到两个完全相同的图嵌入网络中,转换成对应的高维向量。通过最小化目标函数训练图嵌入网络中的参数,计算两个高维向量的余弦距离,输出两个二进制函数的相似度。提高了二进制函数相似性检测的准确率。

    生成对抗网络与多模态融合的假新闻检测方法

    公开(公告)号:CN113221872B

    公开(公告)日:2022-09-20

    申请号:CN202110607067.1

    申请日:2021-05-28

    Abstract: 本发明涉及生成对抗网络与多模态融合的假新闻检测方法,属于机器学习领域。主要为了解决单模态假新闻检测特征不足,多模态假新闻检测中不同模态特征之间异质性较大且拼接方式简单,模型训练过程局限于单一数据集,导致假新闻检测准确率和模型泛化性低下的问题。本发明首先需要训练条件生成对抗网络,该网络可以根据输入图片输出描述图片的文本特征;然后提取新闻的文本特征和图片特征,使用条件生成对抗网络将新闻图片特征转化为文本特征,将新闻文本特征、描述新闻图片的文本特征和新闻的图片特征进行张量融合;最后,将融合的特征输入神经网络得到新闻真实性的分类结果。

    自适应性能的列车加速方法

    公开(公告)号:CN115056825A

    公开(公告)日:2022-09-16

    申请号:CN202210536855.0

    申请日:2022-05-17

    Abstract: 本发明涉及自适应性能的列车加速方法,属于计算机与信息科学技术领域。本发明首先对含噪的列车运行数据建立目标列车性能估计模型,拟合级位序列和速度与加速度之间的函数关系;然后依次查询不同速度区间下各级位对应加速度值,建立加速度随级位和速度变化的关系表,称为列车专属性能表;最后将加速度范围约束引入专属性能表,逐车生成与目标车辆相适配的推荐速度。本发明利用车辆专属性能表,对推荐加速度范围进行约束,生成与受控列车匹配的自适应性能推荐速度,减少级位切换频率,提高自动驾驶平稳性及节能水平。

    一种计算机网络安全检测系统及方法

    公开(公告)号:CN114780945A

    公开(公告)日:2022-07-22

    申请号:CN202210432983.0

    申请日:2022-04-22

    Abstract: 本发明公开了一种计算机网络安全检测系统及方法,包括虚拟验证系统,所述虚拟验证系统与二次装载单元对接,所述虚拟验证系统用于提供待装载APP的临时安装空间,控制待装载APP授权后进行装载并运行APP,进行虚拟敏感信息模拟后,对APP获取的信息对应权限进行验证,本发明涉及网络安全检测技术领域。该计算机网络安全检测系统及方法,通过构建出APP的临时安装空间,对APP进行试运行,并通过模拟虚假敏感信息的方式提供数据源,再通过权限分类的方式进行敏感信息的权限验证,有效识别出APP的敏感信息获取程度,进行实现对APP的安全检测,有效保证计算机用户在安装不明来源APP时的网络安全,保障计算机用户使用APP时的安全性。

    少样本元提升学习的列车运动状态估计方法

    公开(公告)号:CN113255225A

    公开(公告)日:2021-08-13

    申请号:CN202110617467.0

    申请日:2021-05-28

    Abstract: 本发明涉及少样本元提升学习的列车运动状态估计方法,属于计算机与信息科学技术领域。主要为解决现有的列车运动状态建模方法无论是物理模型或是机器学习模型,均存在高成本建模问题,难以针对特定列车实现模型在线持续自适应以精确仿真,存在系统性仿真误差,而且难以满足列车自动驾驶系统的实时仿真等应用需求问题。本发明首先基于元数据采用元梯度提升学习算法建立模型,然后面向新任务,基于少量数据采用任务梯度提升学习算法,完成任务模型学习,实现对新列车的快速低成本精确仿真。结果表明本发明能较为准确的估计的列车运动状态,既减少了模型的训练成本,又提高了列车运动状态估计的精确度。

    一种PE恶意软件检测模型的后门对抗样本生成方法

    公开(公告)号:CN113254930A

    公开(公告)日:2021-08-13

    申请号:CN202110594259.3

    申请日:2021-05-28

    Abstract: 本发明涉及一种基于R‑DBSCAN的PE恶意软件检测模型的后门对抗样本生成方法,属于计算机恶意软件检测领域。主要为了解决恶意软件检测模型在黑盒情形下攻击难度高的问题。本发明首先从公开数据集中获取PE样本并训练代理训练模型,采用SHAP值减维数据集;采用R‑DBSCAN方法对样本聚类,取每一聚类的中心节点作为采样点构建新的数据集;训练神经网络模型;分别输入恶意以及良性样本文件,依据神经网络内部神经元权值变化情况记录对分类结果影响较大的神经元;嵌入任意长度字符串至空PE文件,依据神经元权值变化情况取对其影响较大的字符串并记录该神经元;将触发器以嵌入原始恶意PE文件,修改标签达到对神经网络的对抗训练。

    融合多模态信息及权重张量的用户身份关联方法

    公开(公告)号:CN113222775A

    公开(公告)日:2021-08-06

    申请号:CN202110607064.8

    申请日:2021-05-28

    Abstract: 本发明涉及融合多模态信息及权重张量的用户身份关联方法,属于机器学习领域。主要为了解决目前用户身份关联方法中使用的用户信息单一,忽略其他模态信息和需要大量的标注数据的问题。本发明收集用户多模态特征信息并进行预处理,构建社交网络用户数据集;然后,使用规则匹配方法获得初始用户匹配矩阵和候选集过滤器;最后通过Transformer编码器和改进的基于权重张量分解的张量融合方法得到用户多模态特征的联合嵌入,使用Triplet Network结构迭代更新Transformer编码器权值,根据两个用户的联合嵌入表示相似性和设定的阈值判断两个用户是否匹配,输出最终用户匹配矩阵。

    结合网络拓扑和商业属性的ICT供应链关键节点识别方法

    公开(公告)号:CN112288495A

    公开(公告)日:2021-01-29

    申请号:CN202011238426.2

    申请日:2020-11-09

    Abstract: 本发明涉及结合网络拓扑和商业属性的ICT供应链关键节点识别方法,属于自然语言处理与机器学习领域。主要为了解决ICT供应链网络节点关键性受到节点本身商业属性和在网络中的拓扑结构的双重影响的问题。本发明首先,利用doc2vec从句子嵌入得到ICT供应链网络供应商节点公司类型、登记状态、住所和经营范围的向量表示,并将注册资本进行归一化,将这四种商业属性的向量和注册资本归一化的数值拼接得到融合五种商业属性的句子向量S1;其次利用Deepwalk算法得到ICT供应链网络节点拓扑嵌入向量S2;最后向量S1和S2进行拼接,并通过线性分类实现ICT供应链网络关键节点识别。在ICT供应链网络的供应商节点信息数据集上实验,结果表明本发明能达到较好的分类效果,准确率达71.4%。

Patent Agency Ranking