-
公开(公告)号:CN115757714A
公开(公告)日:2023-03-07
申请号:CN202211331155.4
申请日:2022-10-28
Applicant: 北京理工大学
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F17/10 , G06F18/214 , G06F18/22 , G06N3/0464
Abstract: 本发明涉及一种强化关联度计算的小样本用户多意图识别方法,属于自然语言处理领域。本发明旨在为用户对话样本标定多个意图标签,首先,利用BERT提取用户对话样本及其对应标签的嵌入表示;其次,计算支持集中标签与样本的关联度以增强标签原型表示,利用标签原型和查询样本构建原型网络;然后,计算多个领域的通用阈值和小样本领域的特定阈值,并以其他领域样本与查询样本的关联度均值为系数计算原型网络阈值;最后,根据原型网络阈值筛选出查询样本对应的多个意图标签。本发明提出强化关联度计算方法,同时考虑嵌入表示的特征值差异和特征维度差异,进一步降低标签间的干扰,并改进原型网络阈值计算方法,有效提升多意图识别任务的准确率。
-
公开(公告)号:CN112422505A
公开(公告)日:2021-02-26
申请号:CN202011090699.7
申请日:2020-10-13
Applicant: 北京理工大学
IPC: H04L29/06
Abstract: 本发明涉及基于高维扩展关键特征向量的网络恶意流量识别方法,属于计算机与信息科学技术领域。本发明首先对网络流量数据进行数据清洗和特征优化表达,采用特征分割与融合的方法从关键字、时段节点、行为组合三个方面构建特征,并进行归一化和标准化处理,获得关键词特征向量、时段特征向量、行为特征向量,顺序拼接获得高维扩展特征向量;然后结合专家调查法和因子分析法,进行关键影响因素分析,得到特征权重集,剔除冗余特征和混淆特征,提取关键特征向量;最后,对训练好的决策树进行AUC值计算和相似度计算,保留效果最好的决策树构建随机森林模型,实现对网络恶意流量的自动化识别和检测。
-