-
公开(公告)号:CN109472020B
公开(公告)日:2022-07-01
申请号:CN201811185491.6
申请日:2018-10-11
Applicant: 重庆邮电大学
IPC: G06F40/289 , G06F40/242 , G06K9/62
Abstract: 本发明请求保护一种特征对齐中文分词方法,包括:101从标记数据和无标记数据中抽取二元词的特征;102通过地球移动距离(Earth Mover’s Distance,以下简称EMD)方法将标记数据和无标记数据进行特征对齐;103通过分类器xgboost训练经过特征对齐后的标记数据的特征,从而预测无标记数据中二元词成词的概率;104从分类器的结果中抽取一部分二元词与步骤101标记数据的二元词整合作为条件随机场的特征并进行训练;105通过建立的模型,对无标记数据进行序列标注分词。本发明主要是通过EMD对标记数据和无标记数据进行特征对齐,并通过分类器学习来预测二元词的成词概率,然后以堆叠的方式整合了条件随机场形成新的分词器。
-
公开(公告)号:CN109472020A
公开(公告)日:2019-03-15
申请号:CN201811185491.6
申请日:2018-10-11
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种特征对齐中文分词方法,包括:101从标记数据和无标记数据中抽取二元词的特征;102通过地球移动距离(Earth Mover’s Distance,以下简称EMD)方法将标记数据和无标记数据进行特征对齐;103通过分类器xgboost训练经过特征对齐后的标记数据的特征,从而预测无标记数据中二元词成词的概率;104从分类器的结果中抽取一部分二元词与步骤101标记数据的二元词整合作为条件随机场的特征并进行训练;105通过建立的模型,对无标记数据进行序列标注分词。本发明主要是通过EMD对标记数据和无标记数据进行特征对齐,并通过分类器学习来预测二元词的成词概率,然后以堆叠的方式整合了条件随机场形成新的分词器。
-
公开(公告)号:CN108667816A
公开(公告)日:2018-10-16
申请号:CN201810353434.8
申请日:2018-04-19
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种网络异常的检测定位方法及系统,涉及互联网安全,深度学习,神经网络领域。包括步骤:首先,将URL按照特殊字符对其进行划分;其次将划分后的URL使用word2vec进行词向量编码;然后,将词向量放至卷积层进行自动地特征处理;接着将卷积层结果与拥有序列注意力机制的注意力层相结合;最后将注意力层结果进行最大池化和全连接操作,得到最终的异常检测结果,同时注意力层的输出也用于对URL种的恶意代码进行定位。本发明具有极好的检测效果,不仅检测率高同时还可以定位URL中的恶意代码片段并可视化,有效的避免了人工特征工程和专家知识方法的弊端。
-
公开(公告)号:CN107909497A
公开(公告)日:2018-04-13
申请号:CN201710963914.1
申请日:2017-10-17
Applicant: 重庆邮电大学
CPC classification number: G06Q50/01 , G06K9/6218
Abstract: 本发明请求保护一种基于密度峰值的多粒度社区发现方法,本方法首先对密度峰值聚类算法存在聚类中心难以确定以及归类易出错的缺点进行改进,使其能准确的发现聚类中心。其次,根据密度峰值聚类的中间结果构造全局社区拓扑结构图,在初始的全局社区图上根据定义的粒层分解规则进行粒层由粗到细自动地划分,通过分解机制划分初始全局社区拓扑结构,得到细粒度层次上的多个独立的社区结构,使得问题求解空间由繁到简。最后,在最终形成的最优粒层空间下得到社交网络社区结构的最优划分。本方法从一定程度上揭示了社交网络内部的层次关系,能快速准确地发现网络中具有的稳定层次结构。
-
公开(公告)号:CN112163170B
公开(公告)日:2022-10-18
申请号:CN202011082763.7
申请日:2020-10-12
Applicant: 重庆邮电大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明属于社交网络分析领域,具体涉及一种基于虚节点和元学习改进社交网络对齐的方法,包括跨社交网络分别添加成对虚节点,加入虚节点后的社交网络在图表示算法中进行新的训练,利用虚节点使得社交网络的向量表示空间变得更加稀疏;利用元学习通过不同的社交网络数据得到对齐所需的先验知识,半监督环境下聚合锚节点周围邻居的信息来更新虚节点的向量,在跨网络环境下利用先验知识去更新测试数据中虚节点的更新方向,虚节点找到在对齐工作中的最佳位置;本发明可以改进利用图表示算法进行的社交网络对齐工作,从表示向量的本质出发,有效的改变了节点表示的训练方式,提升这些算法的准确率。
-
公开(公告)号:CN113095478A
公开(公告)日:2021-07-09
申请号:CN202110300668.8
申请日:2021-03-22
Applicant: 重庆邮电大学
Abstract: 本发明属于图神经网络分析领域,具体涉及一种基于图数据中节点之间相关性的图神经网络攻击方法,包括构建代理模型并对该模型进行优化训练;代理模型训练好以后,将代理模型线性化,去掉网络结构中所有的激活函数;计算代理模型对目标点进行分类之后的每个节点之间的相关度;若正确类中相关度最高两点之间存在边关系,则计算删除该边后的影响值;若第二可能类中相关度最高两点之间不存在边关系,则计算连接两个后的影响值;将上述影响值最小的作为当前修改,将本次修改后的图作为下一次攻击的起始图;重复以上操作进行K次迭代,K次迭代后的图作为最终的扰动样本;本发明有效提升目标模型与代理模型的一致性,提升了攻击的成功率。
-
公开(公告)号:CN107480125B
公开(公告)日:2020-08-04
申请号:CN201710543849.7
申请日:2017-07-05
Applicant: 重庆邮电大学
IPC: G06F40/211 , G06F40/30 , G06F16/35 , G06F16/36
Abstract: 本发明请求保护一种基于知识图谱的关系链接方法,首先,从知识图谱中利用SparQL查询语句找到包含某关系的三元组 列表集,并从非结构化的文本中匹配关系文本;使用LSWMD算法得到关系文本的相似性矩阵,再利用密度峰值聚类算法对关系文本进行聚类,得到关系文本类簇;基于关系文本类簇,抽取类簇中所有词语的位置,并利用贝塔分布进行拟合,得到关系文本类簇的词语分布模式;对于开放领域非结构化文本中未确定关系的候选关系文本,利用词语分布模式构建向量,并利用GBDT分类器进行识别,进而与知识图谱中的关系进行链接。本发明有效解决了将自然语言与知识图谱链接不充分的问题,能够帮助计算机更好的理解自然语言。
-
公开(公告)号:CN107491779A
公开(公告)日:2017-12-19
申请号:CN201710502536.7
申请日:2017-06-27
Applicant: 重庆邮电大学
IPC: G06K9/62
CPC classification number: G06K9/6223 , G06K9/6265
Abstract: 本发明请求保护一种基于密度峰值的网格聚类算法,能够高效的对大规模数据进行处理。首先,本文将N维空间粒化为不相交的长方形网格单元,然后统计单元空间的信息。利用密度峰值聚类寻找中心点的思想确定中心单元,即中心网格单元被一些低局部密度的数据单元包围,而且与比自身局部密度高的网格单元的距离相对较大。最后合并与中心网格单元相近网格单元,从而得出聚类结果。在UCI人工数据集上的仿真实验结果表明,本文算法能够较快的得出聚类中心,有效的处理大规模数据的聚类问题,具有较高的效率,与原始的密度峰值聚类算法相比,在不同数据集上时间损耗降低10~100倍,而精度损失维持在5%~8%。
-
公开(公告)号:CN115908940A
公开(公告)日:2023-04-04
申请号:CN202211576322.1
申请日:2022-12-09
Applicant: 重庆邮电大学
IPC: G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明属于图神经网络分析领域,具体涉及到一种一种基于图元表示的图神经网络图数据分类方法;包括获取图数据集并进行划分,即将数据计划分为训练集和测试集;使用图元识别方法得到图数据中的图元集;构建图神经网络模型并进行预训练;基于图元集对图元区域进行特征遮罩从而得到图元区域向量表示;基于图元向量表示和未被图元覆盖的子图区域向量表示得到图级别向量表示;构建线性分类模型;依据此模型和图级别向量表示得到图数据分类结果;本发明采用图神经表示学习方法得到预训练的图神经网络模型,随后通过对图元节点进行序列特征遮罩得到图元区域向量表示和未被图元区域覆盖的子图区域向量表示,以得到图级别向量表示,从而学习到更易区分的图级别向量表示,提高了图数据分类的准确性。
-
公开(公告)号:CN108667816B
公开(公告)日:2021-07-13
申请号:CN201810353434.8
申请日:2018-04-19
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种网络异常的检测定位方法及系统,涉及互联网安全,深度学习,神经网络领域。包括步骤:首先,将URL按照特殊字符对其进行划分;其次将划分后的URL使用word2vec进行词向量编码;然后,将词向量放至卷积层进行自动地特征处理;接着将卷积层结果与拥有序列注意力机制的注意力层相结合;最后将注意力层结果进行最大池化和全连接操作,得到最终的异常检测结果,同时注意力层的输出也用于对URL种的恶意代码进行定位。本发明具有极好的检测效果,不仅检测率高同时还可以定位URL中的恶意代码片段并可视化,有效的避免了人工特征工程和专家知识方法的弊端。
-
-
-
-
-
-
-
-
-