-
公开(公告)号:CN112711948B
公开(公告)日:2022-11-11
申请号:CN202011530521.X
申请日:2020-12-22
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种中文句子的命名实体识别方法,包括:将中文字符序列输入识别模型,由识别模型通过字符嵌入层将中文字符序列转换为字向量并输出到识别模型中的卷积网络,卷积网络对每个字向量进行卷积运算得到局部语义向量并输出到识别模型中的自适应结合层,自适应结合层对字符的局部语义向量进行注意力计算后与对应字向量拼接得到表征向量并输出到识别模型中的序列建模网络,序列建模网络对字符的表征向量进行隐层建模并将建模得到的隐层向量输出到识别模型中的标签推理层计算字符的隐层向量对应的标签。通过卷积网络提取字符的局部语义信息后与潜在词基于字词间注意力实现字词信息融合,从而实现潜在词信息的利用,避免词边界错误传递的问题。
-
公开(公告)号:CN114565002A
公开(公告)日:2022-05-31
申请号:CN202111314525.9
申请日:2021-11-08
Applicant: 北京邮电大学
Abstract: 本申请提供了一种基于行为与注意力机制的异常行为检测方法、系统及计算机介质,获取用户行为,并提取行为序列特征以及行为统计特征;融合行为序列特征以及行为统计特征,得到行为融合特征;将行为融合特征输入注意力机制的LSTM网络进行训练,得到异常行为检测模型;将待检测用户行为输入异常行为检测模型,得到异常行为检测结果。本申请使用用户历史行为与注意力机制相结合的技术手段来实现对不同用户行为模式的识别,最终实现更高精度和准确性的检测模型来降低一部分组织或企业因内部用户异常行为而造成的威胁以及损失。
-
公开(公告)号:CN110019253B
公开(公告)日:2021-10-12
申请号:CN201910313368.6
申请日:2019-04-18
Applicant: 北京邮电大学
IPC: G06F16/22 , G06F16/2458
Abstract: 本发明实施例提供了一种分布式的图数据序列采样方法及装置,应用于分布式的计算节点,所述分布式的计算节点包括:两个以上计算节点,其中所述方法包括:获取预设的图数据、采样次数及采样路径长度;将所述采样次数均分,得到每个计算节点各自的采样次数,作为采样分配次数;从每个计算节点处理的路径集合中,按照所述采样路径长度,确定出路径长度与所述采样路径长度的数值相同的目标路径,所述目标路径是由边数量与所述采样路径长度的数值相同的所述图数据的边形成的,所述图数据的每条边包括至少一个元素;对每个计算节点的目标路径,基于预先确定的权重,分别从形成该目标路径的每条边包括的至少一个元素中抽取一个元素,得到采样元素序列。
-
公开(公告)号:CN113239926A
公开(公告)日:2021-08-10
申请号:CN202110671289.X
申请日:2021-06-17
Applicant: 北京邮电大学
Abstract: 基于对抗的多模态虚假信息检测模型涉及虚假信息检测技术领域,解决了现有虚假信息伪装则检测器检测常出现错误的问题,该装置包括视觉特征提取模块、多模态预训练模块、协同视觉‑文本多头注意力模块和对抗训练模块;多模态预训练模块用于得到多融合的文本序列特征、视觉序列特征和图文内容特征;协同视觉‑文本多头注意力模块用于得到多模态线索不同层次关系的文本内容特征和视觉内容特征;对抗训练模块用于从文本、视觉和图文角度对抗训练模型以提高鲁棒性。本发明可以捕捉信息数据的多模态线索之间元素级别和模态级别的关系,充分挖掘线索之间的隐藏联系;使得多模态预训练模块能够直接应用于虚假信息检测中。
-
公开(公告)号:CN110263153B
公开(公告)日:2021-04-30
申请号:CN201910403543.0
申请日:2019-05-15
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F40/247 , G06F40/289
Abstract: 本发明涉及话题发现领域,特别涉及一种面向多源信息的混合文本话题发现方法。本发明具体包括以下步骤:步骤一、对原始数据进行特征融合,得到特征均匀的结果集D;步骤二、对步骤一中得到特征均匀的结果集D,基于狄利克雷多项式混合模型的聚类方法进行聚类。本发明能够将文本向量特征不均匀的多源文本数据均匀化;通过DMM模型,提升对高噪声、低信息量的短文本数据的话题检测效果;能自动识别出聚类的类别个数,不需要事先给定簇的个数。
-
公开(公告)号:CN110489607B
公开(公告)日:2021-04-02
申请号:CN201910705957.9
申请日:2019-08-01
Applicant: 北京邮电大学
IPC: G06F16/901 , G06F16/903
Abstract: 本发明实施例提供了一种同构子图查询方法、装置、电子设备及存储介质,其中,该方法包括:获取查询图和目标图,并分别对查询图和目标图进行分解,使用分解得到查询子图,对每个分解得到的目标子图进行同构操作,得到每个目标子图对应的同构子图;获取查询图任意两个节点间的最短路径,并在最短路径中选择最大距离;计算第一同构子图和第二同构子图的最短路径的最大值,在第一同构子图和第二同构子图的最短路径的最大值小于或等于在最短路径中选择的最大距离时;对第一同构子图和第二同构子图进行连接,得到目标图中与查询图对应的同构子图。无需遍历目标图的所有节点。从而可以提高同构子图的查询效率。
-
公开(公告)号:CN110263153A
公开(公告)日:2019-09-20
申请号:CN201910403543.0
申请日:2019-05-15
Applicant: 北京邮电大学
Abstract: 本发明涉及话题发现领域,特别涉及一种面向多源信息的混合文本话题发现方法。本发明具体包括以下步骤:步骤一、对原始数据进行特征融合,得到特征均匀的结果集D;步骤二、对步骤一中得到特征均匀的结果集D,基于狄利克雷多项式混合模型的聚类方法进行聚类。本发明能够将文本向量特征不均匀的多源文本数据均匀化;通过DMM模型,提升对高噪声、低信息量的短文本数据的话题检测效果;能自动识别出聚类的类别个数,不需要事先给定簇的个数。
-
公开(公告)号:CN110222172A
公开(公告)日:2019-09-10
申请号:CN201910403573.1
申请日:2019-05-15
Applicant: 北京邮电大学
IPC: G06F16/35
Abstract: 本发明公开了一种基于改进层次聚类的多源网络舆情主题挖掘方法,涉及主题挖掘领域。具体包括以下步骤:步骤一、获取词向量;步骤二、对所有数据进行预处理;步骤三、对步骤二预处理后总的样本数据句向量化;步骤四、进行句向量半监督层次主题挖掘;步骤五、输出树状图Dendrogram。本发明利用层次聚类算法包含层次信息的优点,并在此基础上从先验知识使用、模型输入向量化、优质主题筛选等角度进行优化,最终使得本文提出的方法能有效适用于主题广泛、文本噪声多、语法缺少规范的多源网络平台短文本的主题挖掘。
-
公开(公告)号:CN103391374A
公开(公告)日:2013-11-13
申请号:CN201310342622.8
申请日:2013-08-08
Applicant: 北京邮电大学
Abstract: 本发明涉及无线通信领域,特别是一种支持无缝切换的双系统终端,包括:非智能子系统和智能子系统,所述非智能子系统和所述智能子系统硬件独立,二者共享无线射频模块、屏幕、语音及其相关I/O接口设备,所述非智能子系统始终保持运行状态,用于进行安全通话和短信通信,所述非智能子系统和所述智能子系统通过硬件开关键完成切换。本发明的目的是通过相互隔离的两个手机系统同时运行并无缝快速切换,给用户提供安全的通信环境,保护用户隐私。
-
公开(公告)号:CN114565002B
公开(公告)日:2025-04-25
申请号:CN202111314525.9
申请日:2021-11-08
Applicant: 北京邮电大学
IPC: G06F18/2433 , G06F18/25 , G06F18/213 , G06N3/0442 , G06N3/045 , G06N3/084
Abstract: 本申请提供了一种基于行为与注意力机制的异常行为检测方法、系统及计算机介质,获取用户行为,并提取行为序列特征以及行为统计特征;融合行为序列特征以及行为统计特征,得到行为融合特征;将行为融合特征输入注意力机制的LSTM网络进行训练,得到异常行为检测模型;将待检测用户行为输入异常行为检测模型,得到异常行为检测结果。本申请使用用户历史行为与注意力机制相结合的技术手段来实现对不同用户行为模式的识别,最终实现更高精度和准确性的检测模型来降低一部分组织或企业因内部用户异常行为而造成的威胁以及损失。
-
-
-
-
-
-
-
-
-