-
公开(公告)号:CN114298029A
公开(公告)日:2022-04-08
申请号:CN202111523723.6
申请日:2021-12-14
Applicant: 广州大学
IPC: G06F40/289 , G06F40/216 , G06F40/30 , G06K9/62 , G06N5/02
Abstract: 本发明公开了一种结合词向量多特征融合的新词发现方法,该方法步骤包括:对语料进行特征标注,计算属性对互信息矩阵和自信息矩阵,计算候选特征属性对得分;聚类词向量,找到对应的最近邻类中心向量,并找出该类中心向量对应的词作为词向量特征属性,遍历所有词向量特征属性对,计算词向量特征属性对自信息矩阵和互信息矩阵,计算所有词向量特征属性对得分;对所有候选特征属性对得分配置优化权重系数后求和计算总得分;总得分超过新词阈值时提取候选词对对应得分向量到样本集合;更新权重系数并迭代训练至损失函数收敛获得最终的权重系数;重新计算候选词对总得分,输出超过新词阈值的新词。本发明实现更合理的新词评价方法,更加有效地挖掘潜在的新词。
-
-
公开(公告)号:CN113780123A
公开(公告)日:2021-12-10
申请号:CN202111001380.7
申请日:2021-08-27
Applicant: 广州大学
Abstract: 本发明公开了一种对抗样本生成方法、系统、计算机设备和存储介质,所述方法包括:对原始人脸图像进行人脸关键点检测,得到人脸的关键点,根据所述关键点构成的掩码区域,得到相对应的掩码矩阵;将原始人脸图像和经过初始化的干扰噪声输入神经网络进行训练,得到第一干扰噪声;将所述第一干扰噪声与所述掩码矩阵相乘,得到干扰区域限制的第二干扰噪声,对所述第二干扰噪声进行高斯滤波,得到第三干扰噪声;将所述第三干扰噪声与所述原始人脸图像相叠加,得到对抗样本;根据预设的迭代条件对所述对抗样本进行多轮迭代计算,得到最终的对抗样本。本发明能够更加精准地实现局部攻击的对抗样本生成效果,提高了人脸对抗样本的抗感知能力和抗检测能力。
-
公开(公告)号:CN113688631A
公开(公告)日:2021-11-23
申请号:CN202110764616.6
申请日:2021-07-05
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种嵌套命名实体识别方法、系统、计算机和存储介质,通过将待识别文本的第一文本词向量表示进行边界检测得到对应的边界词概率和边界文本向量表示,再采用条件随机场进行解码和标注得到第一实体识别结果,以及根据边界词概率和预设概率阈值判断边界文本向量表示中是否存在嵌套命名实体边界词,并在存在时,将相邻嵌套命名实体边界词之间的边界文本向量表示合并得到的第二文本词向量表示进行边界检测开始下一轮实体识别迭代,反之,停止迭代,将第一实体识别结果作为待识别文本的实体识别结果的方法,有效识别命名实体的边界且缩减了候选实体子序列的数目,有效降低命名实体的解码复杂度,进一步提高嵌套实体预测识别能力和实用性。
-
公开(公告)号:CN113139774A
公开(公告)日:2021-07-20
申请号:CN202110448348.7
申请日:2021-04-25
Applicant: 广州大学
Abstract: 本发明公开了一种面向多仓库运输的车辆路径优化方法,包括:计算客户节点距离所有仓库的距离,将客户节点分配至距离最近的仓库,分配完成后,针对每一个仓库及其被分配到该仓库的客户节点,使用人工蜂群算法找到部分最优解;将针对单一仓库节点的车辆调度路线集合合并为一个集合,组成针对多仓库车辆路径问题的总车辆调度路线集合,实现车辆路径的优化。本发明提通过分配,修正及合并阶段的设置,将多仓库背景划归为单仓库背景,使得可以并行地计算针对每一个单仓库的车辆路径调度路线,从而缩小了调度路线的搜索范围,提高了计算效率;且由于蜂群中跟随蜂和巡回蜂的存在,使得其不易陷入局部最优导致过早收敛,更容易找到更好的近似解。
-
公开(公告)号:CN113139603A
公开(公告)日:2021-07-20
申请号:CN202110447846.X
申请日:2021-04-25
Applicant: 广州大学
Abstract: 本发明公开了一种基于EMD距离融合多源异构数据的联邦学习方法,其中,联邦模型进行训练包括:各参与方对己方本地数据Xi进行预处理并分块;中心服务器选取要训练的联邦模型并初始化模型参数;参与方结合本地数据对模型进行训练;各参与方计算各方数据块相对于整体模型的EMD距离,中心服务器对各方数据块的EMD距离从小到大排序,去掉EMD距离超过K的数据块,发送剩下的数据块编号给对应的参与方;对进入下一轮迭代的参与方的数据重新划分数据块,重复执行步骤S3‑S4,直到结果收敛。本发明可以定量地测量多源异构数据的质量,在模型逐步优化的过程中去掉不够优质的数据,提高了联邦模型最后的效果。
-
公开(公告)号:CN112529047A
公开(公告)日:2021-03-19
申请号:CN202011317776.8
申请日:2020-11-23
Applicant: 广州大学
Abstract: 本发明公开了一种基于梯度屏蔽的对抗样本生成方法,包括:S1,将原始输入图像X表示成a×b的矩阵D,记为D=Da×b;S2,采用目标检测算法在矩阵D中进行核心区域定位,得到核心区域DS;S3,运行基于梯度的攻击方法得到梯度矩阵MG;S4,基于核心区域DS和梯度矩阵MG构造梯度屏蔽矩阵H;S5,将梯度矩阵MG与梯度屏蔽矩阵H对应相乘得到更新梯度矩阵M'G;S6,依据公式完成对抗样本的构造:S7,重复执行步骤S3‑S6进行K轮迭代,最终得到基于区域的梯度屏蔽方法的对抗样本。本发明既实现了高效的对抗样本生成,拥有与梯度攻击相似的成功率,又减少了对抗样本相对于原始样本的扰动,提高了对抗样本的抗感知能力和抗检测能力。
-
公开(公告)号:CN111860832A
公开(公告)日:2020-10-30
申请号:CN202010618973.7
申请日:2020-07-01
Applicant: 广州大学
Abstract: 本发明提供一种基于联邦学习的增强神经网络防御能力的方法,包括以下步骤:S1、利用联邦学习,使数据留在本地并防止数据隐私泄露,协同各方进行分布式的模型训练,对中间结果进行加密以保护数据安全,汇总后融合多方模型得到联邦模型。S2、建立对抗样本,并采用算法对对抗样本进行快速寻找。该方法把联邦学习和神经网络模型的训练过程结合起来,解决了处于隐私保护的考虑以及法律法规限制而导致的数据集不能流通的困境,省去了数据收集的麻烦,同时使得神经网络模型的训练集更加丰富,更加独立,克服了由于训练集不完备导致的神经网络模型容易被对抗样本攻击的能力。
-
公开(公告)号:CN111813953A
公开(公告)日:2020-10-23
申请号:CN202010577664.X
申请日:2020-06-23
Applicant: 广州大学
Abstract: 本发明公开了一种基于知识体的分布式知识图谱构建系统及方法,系统采用软构件思想,将知识图谱分解为一个个运行的知识体,以此构建基于知识体的分布式知识图谱。其中,知识体工厂用于生成和组装知识体,知识体库存储知识体并建立目录索引,知识体检索器用于从知识体目录检索知识体和从构件库中检索基础构件,知识体部署器用于把知识体部署到知识体容器中运行,目录服务用于将该运行的知识体注册到知识体目录中。构建得到的分布式网络安全知识图谱支持就近的网络安全知识匹配和网络安全事件发现,多个知识体之间可以交互,也支持多知识体面向任务的协同计算和协同推理,以发现复杂攻击和更大规模的网络安全事件。
-
公开(公告)号:CN111523014A
公开(公告)日:2020-08-11
申请号:CN202010337835.1
申请日:2020-04-24
Applicant: 广州大学
IPC: G06F16/951 , G06K9/34 , G06K9/62
Abstract: 本发明公开了一种基于对抗样本的开源数据处理方法及系统,该方法先将开源数据信息X拆解为多个不可分割的最小单位,组成图片集A,再根据图片集A和识别模型B生成对抗样本图片集D,满足图片d和图片a的差距小于预设阈值δ,最后将对抗样本图片集D进行拼接,生成开源数据信息X’,以供网络前端展示。本发明技术方案在不影响普通用户正常阅读、使用开源数据的前提下,让网络爬虫即使能够抓取到数据,也难以正确分析出其中的信息,提高破解难度和成本。
-
-
-
-
-
-
-
-
-