-
公开(公告)号:CN110543634B
公开(公告)日:2021-03-02
申请号:CN201910822709.2
申请日:2019-09-02
Applicant: 北京邮电大学
IPC: G06F40/211 , G06F40/216 , G06F40/295 , G06F16/35 , G06F16/36
Abstract: 本发明实施例提供了一种语料数据集的处理方法、装置、电子设备及存储介质,可以实现获取原始的语料数据集,语料数据集中包括多条提及以及预先针对各条提及标注的标签数据;判断语料数据集中的各条提及之间是否具有关联关系;针对具有关联关系的关联提及,根据关联提及的标签数据,计算关联提及的边缘概率;从语料数据集中,删除边缘概率小于预设概率值的关联提及。应用本发明可以剔除语料数据集中人为标注带来的错误信息,降低语料数据集中的噪声问题,进而提高模型训练的准确度,提高关系提取的准确率。
-
公开(公告)号:CN111552855A
公开(公告)日:2020-08-18
申请号:CN202010364312.6
申请日:2020-04-30
Applicant: 北京邮电大学
IPC: G06F16/951 , G06F16/9535 , G06N3/08 , G06N3/04
Abstract: 本发明实施例提供了一种基于深度学习的网络威胁情报自动抽取方法,能够获取情报源数据,并判断情报源数据的数据结构类型;若数据结构类型为非结构化类型,则将情报源数据输入预先训练的情报实体识别模型,得到情报源数据中的各情报实体,情报实体识别模型为利用情报样本数据,基于预先设置的字与字的前后位置约束条件,训练得到的神经网络模型;按照预先设置的组合形式,将各情报实体组合得到网络威胁情报。应用本发明可以利用预先训练的情报实体识别模型进行网络威胁情报的自动抽取,而情报实体识别模型在训练时引入的位置约束条件限制情报实体中字与字的前后位置关系,因此减少情报实体乱序的结果出现,从而提高网络威胁情报识别的准确率。
-
公开(公告)号:CN111355725A
公开(公告)日:2020-06-30
申请号:CN202010120695.2
申请日:2020-02-26
Applicant: 北京邮电大学
Abstract: 本发明实施例提供的一种网络入侵数据的检测方法及装置,其中方法包括:获取各个网段内的数据,将各个网段内的数据输入预先训练好的网络入侵检测模型,得到各个数据对应的检测结果。本发明实施例使用预先训练好的网络入侵检测模型检测各个网段的数据,预先训练好的网络入侵检测模型中低于预设权重阈值的权重的值为零,并且预先训练好的网络入侵检测模型是在低于预设权重阈值的权重置零后的网络入侵检测模型中,成本值最小的网络入侵检测模型,该网络入侵检测模型仅保留权重不低于权重阈值的通道的连接,从而降低了网络入侵检测模型的复杂性和冗余度,减少了网络入侵检测模型过拟合的风险,提高了网络入侵检测模型的识别网络入侵数据的准确率。
-
公开(公告)号:CN111340075A
公开(公告)日:2020-06-26
申请号:CN202010093097.0
申请日:2020-02-14
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种ICS的网络数据检测方法及装置,其中,方法包括:使用非异常数据对预设的树集成数据识别模型进行再训练,当再训练后的树集成数据识别模型的各个二叉树子模型中,存在叶子节点对应的网络数据个数大于第二阈值的二叉树子模型时,则该二叉树子模型出现了失衡现象,表示该二叉树子模型对树集成数据识别模型的精确度造成较大影响,将该二叉树子模型从再训练后的树集成数据识别模型中删除,得到新的树集成数据识别模型,提高了新的预设的树集成数据识别模型准确性,因此可以提高识别ICS的网络数据的准确性,提高对ICS进行安全防护的准确性。
-
公开(公告)号:CN111144709A
公开(公告)日:2020-05-12
申请号:CN201911244272.5
申请日:2019-12-06
Applicant: 北京邮电大学
IPC: G06Q10/06 , G06F40/289 , G06F40/211
Abstract: 本发明实施例提供了一种机器生成文本的新颖度确定方法及装置:获取机器生成文本以及机器生成文本对应的多个参考文本;根据机器生成文本包括的词语,以及多个参考文本包括的词语,确定机器生成文本的重叠因子;根据机器生成文本包括的短句,确定机器生成文本的重复惩罚因子;根据机器生成文本的文本长度,多个参考文本的平均文本长度以及多个参考文本的最小文本长度,确定机器生成文本的长度惩罚因子;根据机器生成文本的重叠因子、重复惩罚因子和长度惩罚因子,确定机器生成文本的新颖度。综合考虑了机器生成文本与参考文本的重叠度,机器生成文本自身的重复度,机器生成文本和参考文本的长度因素,更有效的衡量机器生成文本的新颖度。
-
公开(公告)号:CN108600013B
公开(公告)日:2019-06-14
申请号:CN201810388188.X
申请日:2018-04-26
Applicant: 北京邮电大学
IPC: H04L12/24
Abstract: 本发明实施例提供一种动态网络的重叠社区发现方法及装置,包括:获取待检测动态网络的初始重叠社区集合;确定变化后的待检测动态网络中的变化后的节点集合、以及变化后的节点集合中的节点之间的有向边;确定变化节点集合;根据随机游走算法,记录变化节点与初始重叠社区集合中每个初始重叠社区的相遇次数;计算最大相遇次数与最小相遇次数的平均值;确定相遇次数大于平均值时对应的初始重叠社区,并将变化节点划分到对应的初始重叠社区中,得到变化后的待检测动态网络的重叠社区集合。本发明实施例通过确定变化节点所属的重叠社区,将变化节点划分到所属的重叠社区中,从而发现变化后的动态网络的重叠社区集合。
-
公开(公告)号:CN103345517B
公开(公告)日:2019-03-26
申请号:CN201310288955.7
申请日:2013-07-10
Applicant: 北京邮电大学
IPC: G06F16/9535 , G06Q30/06
Abstract: 本文提出了一种推荐领域中全新的计算用户相似性的方法,该方法模拟搜索技术中常用的词频‑反文档频率(TF‑IDF)的统计方法,无需多次计算目标用户与邻居用户共同评分项值以及用户对物品的具体评分值,便可计算出用户之间的相似性。然后再利用得到的相似性,求出用户对物品的预测评分,最终做出推荐。该方法可以有效提高推荐的准确率与实时性,并且增加了推荐系统的可扩展性。
-
公开(公告)号:CN108512846A
公开(公告)日:2018-09-07
申请号:CN201810276386.7
申请日:2018-03-30
Applicant: 北京邮电大学
IPC: H04L29/06
Abstract: 本发明实施例提供了一种终端与服务器之间的双向认证方法和装置,应用于终端,终端可以根据终端私钥和第一预设随机数,得到加密字符串,并发送至服务器,以使服务器对终端进行认证,根据与服务器对应的公钥,对服务器发送的验证字符串进行解密,得到服务器的认证结果;应用于服务器,服务器在接收到终端发送的加密字符串时,根据与终端对应的公钥,对加密字符串进行解密,如果解密失败,判定终端认证失败,否则,判定终端认证成功,根据解密结果、服务器私钥和第二预设随机数,生成验证字符串,并发送至终端,以使终端对服务器进行认证。基于上述处理,终端和服务器不需要下载和导入证书,且交互次数较少,适用于计算能力较低的终端。
-
-
-
-
-
-
-