一种基于叠加卷积稀疏自编码机的表示学习方法

    公开(公告)号:CN111753898A

    公开(公告)日:2020-10-09

    申请号:CN202010581332.9

    申请日:2020-06-23

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于叠加卷积稀疏自编码机的表示学习方法,其特包括以下步骤:1)设计和实现包括白化的重构独立成分分析算法,并将图像数据集作为输入,迭代优化学习其输出的重构矩阵,得到训练完成的稀疏自编码模型;2)构建半监督叠加稀疏自编码机模型对特征表示做训练;3)构建卷积模型从数据中提取块特征,应用卷积和池化操作生成卷积特征表示;4)将卷积稀疏自编码机进行叠加,对卷积特征表示进行进一步优化;5)用逻辑回归模型在图像数据集上训练分类器,并得到分类结果。本发明结合自编码机模型和卷积池化结构的特点,并利用大规模数据集中的少部分有标签数据,达到优化特征表示向量,提高图像数据集分类准确度。

    一种基于并行自编码机的协同过滤推荐方法

    公开(公告)号:CN111652695A

    公开(公告)日:2020-09-11

    申请号:CN202010529350.2

    申请日:2020-06-11

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于并行自编码机的协同过滤推荐方法,包括以下步骤:1构建稀疏自编码机模型完成用户潜在特征表示的目标函数,学习基于用户的高层次抽象特征,得到用户评分矩阵的重构矩阵;2构建图正则化自动编码机模型完成商品潜在特征表示的目标函数,学习基于商品的高层次抽象特征,得到商品评分矩阵的重构矩阵;3将基于用户评分矩阵的重构矩阵和基于商品评分矩阵的重构矩阵进行矩阵相乘,得到用户对商品感兴趣的预测矩阵,并根据结果对用户进行推荐。本发明能够并行利用不同结构的自编码机且同时学习用户和商品的不同特征信息,提取用户和商品更准确的高层次抽象特征,利用提取的抽象特征进行预测,达到为用户进行更准确推荐的目的。

    一种基于局部保持典型相关分析的幻觉脸方法

    公开(公告)号:CN111640064A

    公开(公告)日:2020-09-08

    申请号:CN202010473403.3

    申请日:2020-05-29

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于局部保持典型相关分析的幻觉脸方法,包括利用局部保持典型相关分析计算高分辨率和低分辨率主成分特征的一致相关特征,利用逆变换将低分辨率人脸图像对应的高分辨率特征重建为全局高分辨率人脸图像;在此基础上,建立高分辨率和低分辨率人脸残差图像并将残差图像分块,利用局部保持典型相关分析抽取高分辨率和低分辨率残差图像块的一致特征,采用逆变换得到高分辨率残差图像块,通过平均重叠区域,组合所有高分辨率残差图像块形成高分辨率残差图像;组合全局高分辨率人脸和高分辨率残差图像,最终得到超分辨率人脸图像。本发明利用局部保持典型相关分析,克服了传统方法不能处理高分辨率和低分辨率图像之间非线性关系的问题。

    一种基于软提示调优模型防御中文文本对抗性攻击方法

    公开(公告)号:CN119848253A

    公开(公告)日:2025-04-18

    申请号:CN202411925450.1

    申请日:2024-12-25

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于软提示调优模型防御中文文本对抗性攻击方法,包括1)使用五种特定于中文的文本攻击策略生成目标域数据,并引入源域和目标域来模拟原始文本和对抗文本;2)基于少量源域数据去训练初始的软提示调优模型,为目标域实例分配伪标签;3)将目标域实例划分为n个子集,通过多次迭代获取目标域实例的n个标签,同时结合图注意力模型分析句法特征;4)通过投票机制选出在多次迭代中一致的标签,作为最终训练数据进行模型训练,实现中文对抗文本的分类预测。本发明通过少量源域数据训练初始模型,揭示目标域的真实标签信息,并通过投票机制结合图注意力增强中文语法特征的软提示调优模型,实现准确分类。

    一种基于提示调优的文本对抗防御方法

    公开(公告)号:CN118349675A

    公开(公告)日:2024-07-16

    申请号:CN202410455499.9

    申请日:2024-04-16

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于提示调优的文本对抗防御方法,包括1)采取四种策略对原始文本进行添加扰动形成对抗文本,并引入源域和目标域来模拟原始文本和对抗文本;2)手动构建提示调优模型的模板;3)在标签词映射器的构建中使用三种词汇注释工具在目标域上进行标注,根据主题分类或情感分类的任务类型抽取名词或形容词,并采用分层聚类和优化策略得到最终的标签词;4)随机选取少量源域数据样本,基于步骤2)和步骤3)中构建出优化的提示调优模型,实现对抗文本的分类预测。本发明基于提示调优模型,在少量源域数据样本的前提下,解决了多种文本攻击方法对文本准确分类的影响,实现文本对抗防御。

    一种基于预训练语言模型的中文点击诱饵检测方法

    公开(公告)号:CN117171342A

    公开(公告)日:2023-12-05

    申请号:CN202310990840.6

    申请日:2023-08-08

    Applicant: 扬州大学

    Abstract: 本发明公开了自然语言处理研究领域的一种基于预训练语言模型的中文点击诱饵检测方法,主要包括在预训练语言模型中处理输入,对输入进行编码,将其转换成模型所需要的编码格式;之后构建BERT模型的嵌入层,将得到的序列编码转换成连续的N维空间向量;再构建编码器,并将步嵌入层输出的隐状态进行非线性的表示,提取其中的特征;最终通过softmax分类器得到最后的预测结果。本发明提高了表示学习和特征提取的效果,能够有效地提取中文点击诱饵的特征,提升了数据集分类的准确性,同时本方法使用微调的方法对模型进行预训练,可以利用较少的数据来获得更准确的检测结果,大大减少了模型的训练成本,具有较高的实用性,适于在文本分类中使用。

    一种自适应的不平衡数据领域适应方法

    公开(公告)号:CN111753899B

    公开(公告)日:2023-10-17

    申请号:CN202010582064.2

    申请日:2020-06-23

    Applicant: 扬州大学

    Abstract: 本发明公开了一种自适应的不平衡数据领域适应方法,包括以下步骤:1)构建叠加稀疏自编码机,学习源领域和目标领域的原始图像数据集的向量表示;2)针对源领域和目标领域的不平衡数据,构建自适应的不平衡数据领域适应目标函数,补偿数量较小的类损失,并应用最大均值差异算法将源领域和目标领域的大量无标签数据信息代入领域适应目标函数,缩小源领域和目标领域的距离;3)用逻辑回归模型在训练集上训练分类器,并在测试集上做分类预测,得到最终的领域适应结果。本发明优化了特征表示学习的性能,提升了领域适应的准确性,具有较高的鲁棒性和实用性。

    基于源代码图表示学习的智能合约多漏洞检测方法及系统

    公开(公告)号:CN113360915B

    公开(公告)日:2023-09-26

    申请号:CN202110643307.3

    申请日:2021-06-09

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于源代码图表示学习的智能合约多漏洞检测方法及系统,该方法结合智能合约的抽象语法树和语义信息,利用函数粒度代码属性图对智能合约源代码进行表征;并根据智能合约不同类型漏洞的语法特征定义切片准则,使用程序切片技术对智能合约图表示进行降噪并结合门控图神经网络进行特征提取,基于提取的特征进行漏洞预测。本发明的优势在于:结合多种图结构表征智能合约源代码,充分保留了代码的语法、语义信息和上下文结构;利用程序切片技术去除与漏洞检测无关的噪声代码,提升了检测的准确性;基于门控图神经网络自动学习多种漏洞的特征,提高了漏洞检测的适用范围和检测效率,降低了检测成本。

    一种基于软提示的医疗文本分类方法

    公开(公告)号:CN116595170A

    公开(公告)日:2023-08-15

    申请号:CN202310427121.3

    申请日:2023-04-20

    Abstract: 本发明公开了一种基于软提示的医疗文本分类方法,包括1)在原始的输入序列中插入可训练的词向量token,固定一些任务相关的锚点token,使用神经网络对其进行随机初始化;2)通过使用四种策略对原有的类别标签词空间进行扩展,将原始输入文本加入软模板后送入预训练语言模型中,利用预训练语言模型的知识库计算每个单词被填入的概率;3)将单词的概率映射到特定的类别标签,得出分类的结果;4)通过损失函数计算真实标签和预测结果之间的误差,不断更新连续模板以及模型参数。本发明不仅大大减少了对人工资源以及对大规模训练样本的依赖,也在一定程度上降低了模型训练的成本,具有较高的鲁棒性和实用性。

    一种分数阶图嵌入多重集典型相关分析方法

    公开(公告)号:CN114841284A

    公开(公告)日:2022-08-02

    申请号:CN202210559435.4

    申请日:2022-05-18

    Applicant: 扬州大学

    Abstract: 本发明公开了一种分数阶图嵌入多重集典型相关分析方法,该方法针对现实应用中常见的噪声干扰,数据量远小于数据维度等干扰特征提取的因素。在本发明方法中,通过在样本数据的奇异值上直接添加分数阶参数来缓解噪声干扰、小样本问题带来的估计偏差,使得奇异值更加接近真实值,从而提升后续特征提取的精确度,使得投影后得到的低维表示更加能够反映真实个体的特征,提升识别率。本方法仅在降维前调整样本数据的奇异值,在并未提高原有算法的时间复杂度的同时,提升了算法的性能。

Patent Agency Ranking