一种基于软提示调优模型防御中文文本对抗性攻击方法

    公开(公告)号:CN119848253A

    公开(公告)日:2025-04-18

    申请号:CN202411925450.1

    申请日:2024-12-25

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于软提示调优模型防御中文文本对抗性攻击方法,包括1)使用五种特定于中文的文本攻击策略生成目标域数据,并引入源域和目标域来模拟原始文本和对抗文本;2)基于少量源域数据去训练初始的软提示调优模型,为目标域实例分配伪标签;3)将目标域实例划分为n个子集,通过多次迭代获取目标域实例的n个标签,同时结合图注意力模型分析句法特征;4)通过投票机制选出在多次迭代中一致的标签,作为最终训练数据进行模型训练,实现中文对抗文本的分类预测。本发明通过少量源域数据训练初始模型,揭示目标域的真实标签信息,并通过投票机制结合图注意力增强中文语法特征的软提示调优模型,实现准确分类。

    一种基于提示调优的文本对抗防御方法

    公开(公告)号:CN118349675A

    公开(公告)日:2024-07-16

    申请号:CN202410455499.9

    申请日:2024-04-16

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于提示调优的文本对抗防御方法,包括1)采取四种策略对原始文本进行添加扰动形成对抗文本,并引入源域和目标域来模拟原始文本和对抗文本;2)手动构建提示调优模型的模板;3)在标签词映射器的构建中使用三种词汇注释工具在目标域上进行标注,根据主题分类或情感分类的任务类型抽取名词或形容词,并采用分层聚类和优化策略得到最终的标签词;4)随机选取少量源域数据样本,基于步骤2)和步骤3)中构建出优化的提示调优模型,实现对抗文本的分类预测。本发明基于提示调优模型,在少量源域数据样本的前提下,解决了多种文本攻击方法对文本准确分类的影响,实现文本对抗防御。

    一种基于近邻保持典型相关分析的人脸识别方法

    公开(公告)号:CN111611963B

    公开(公告)日:2023-12-26

    申请号:CN202010473892.2

    申请日:2020-05-29

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于近邻保持典型相关分析的人脸识别方法,其包括以下步骤:1:输入人脸训练数据集X∈Rm×N,Y∈Rn×N,通过近邻保持学习计算图像的近邻权重重建矩阵Ux和Uy;2:采用典型相关分析寻找两组投影向量wx和wy,用最优化方法将近邻保持引入典型相关分析的框架之中,利用广义特征值分解计算投影矩阵Wx和Wy;3:采用两种特征融合策略对测试人脸图像的低维投影#imgabs0#和#imgabs1#进行融合;4:利用最近邻分类器将融合后的特征用于人脸识别。本发明通过近邻保持学习人脸邻近权重重建矩阵,用最优化方法将近邻保持引入典型相关分析框架中,再利用人脸的标签信息,这样提取出的人脸特征不仅最大化了不同人脸间的相关性,而且还最大可能地保持了人脸的邻域结构,提高了人脸识别能力和稳定性。

    一种自适应的不平衡数据领域适应方法

    公开(公告)号:CN111753899B

    公开(公告)日:2023-10-17

    申请号:CN202010582064.2

    申请日:2020-06-23

    Applicant: 扬州大学

    Abstract: 本发明公开了一种自适应的不平衡数据领域适应方法,包括以下步骤:1)构建叠加稀疏自编码机,学习源领域和目标领域的原始图像数据集的向量表示;2)针对源领域和目标领域的不平衡数据,构建自适应的不平衡数据领域适应目标函数,补偿数量较小的类损失,并应用最大均值差异算法将源领域和目标领域的大量无标签数据信息代入领域适应目标函数,缩小源领域和目标领域的距离;3)用逻辑回归模型在训练集上训练分类器,并在测试集上做分类预测,得到最终的领域适应结果。本发明优化了特征表示学习的性能,提升了领域适应的准确性,具有较高的鲁棒性和实用性。

    一种基于人机协作的中文词语替代数据集的构造方法

    公开(公告)号:CN116628131A

    公开(公告)日:2023-08-22

    申请号:CN202310447979.6

    申请日:2023-04-24

    Applicant: 扬州大学

    Inventor: 李滢 强继朋 刘康

    Abstract: 本发明公开了一种基于人机协作的中文词语替代数据集的构造方法包括,选取原始语料进行人工筛选,利用分句工具构建句子集合;将语句进行分词并按照规则筛选待替换的目标词及位置信息,构建中文拼写纠错的数据集,并将数据集划分;生成所有目标词的替代词并生成向标注者提供的待标注信息,构造数据标注网站。基于人机协作的构建方法,利用方法生成大量词语替代选项构建中文词语替代数据集。采用了多个标注者对同一目标词进行标注的方法,以确保数据的准确性和公平性。为标注者提供了丰富的标注规则和标注指南,同时进行了严格的质量控制和审核,保证了数据的高质量和准确性。

    一种基于复杂词变化解码的中文词语简化方法及系统

    公开(公告)号:CN116341526A

    公开(公告)日:2023-06-27

    申请号:CN202310330236.0

    申请日:2023-03-30

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于复杂词变化解码的中文词语简化方法,包括:基于中文汉语考试词汇等级表,识别词语难度等级,将高难度词语作为目标复杂词;构建中文复述语料,训练中文复述模型;利用所述中文复述模型并基于复杂词变化解码方法,生成存在候选简化词的复述句子;从生成的复述句子中,获取候选简化替代词;利用开源工具和词频对所述候选简化替代词进行排序,获取最终简化词。本发明构造了一个大规模的中文复述语料;利用复述模型进行中文词汇简化任务,并提出了一种基于复杂词变化的解码方法,提高简化准确率;在候选词排序中加入BARTscore,考虑替代词对句子原意的改变。

    一种分数阶图嵌入多重集典型相关分析方法

    公开(公告)号:CN114841284A

    公开(公告)日:2022-08-02

    申请号:CN202210559435.4

    申请日:2022-05-18

    Applicant: 扬州大学

    Abstract: 本发明公开了一种分数阶图嵌入多重集典型相关分析方法,该方法针对现实应用中常见的噪声干扰,数据量远小于数据维度等干扰特征提取的因素。在本发明方法中,通过在样本数据的奇异值上直接添加分数阶参数来缓解噪声干扰、小样本问题带来的估计偏差,使得奇异值更加接近真实值,从而提升后续特征提取的精确度,使得投影后得到的低维表示更加能够反映真实个体的特征,提升识别率。本方法仅在降维前调整样本数据的奇异值,在并未提高原有算法的时间复杂度的同时,提升了算法的性能。

    一种基于提示学习的领域自适应方法

    公开(公告)号:CN114817550A

    公开(公告)日:2022-07-29

    申请号:CN202210555187.6

    申请日:2022-05-19

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于提示学习的领域自适应方法,包括以下步骤:1)选择Bert模型,将该预训练语言模型作为主干,对提示学习方法中的模板和标签词进行设置;2)构造出所需要的提示学习模型,对于数据集,运用提示学习数据加载函数对数据进行加载和处理,之后进行领域自适应任务;3)随机选取少量源域数据样本进行训练,之后将目标域的句子嵌入到同样的模板中,通过预训练语言模型进行掩码语言建模,对输入的目标域句子进行分类预测。本发明利用提示学习的方法,可以解决源域和目标域中语义特征结构的扭曲和类别可辨别性的丢失,在少量源域数据样本的前提下,能够在目标域分类任务中达到更好的准确度。

    一种中文拼写纠错的数据集构造方法

    公开(公告)号:CN114638215A

    公开(公告)日:2022-06-17

    申请号:CN202210231235.6

    申请日:2022-03-10

    Applicant: 扬州大学

    Inventor: 钦唯一 强继朋

    Abstract: 本发明公开了一种中文拼写纠错的数据集构造方法,包括步骤1)以人工筛选的形式获取新闻文档语句列表;步骤2)构建同音词集合;步骤3)根据同音词集合对新闻文档语句进行筛选;步骤4)对初始新闻语句,获得替换一个同音不同形的词语后句子组成的集合;步骤5)获得被替换的词语和其位置信息;步骤6)由初始新闻语句和相应替换词语后的句子组成句子对序列。本发明充分利用文档中的同音词集合,能够在没有任何人工干预的情况下标记句子中出错的词语及其位置,填补了中文文本简化领域的空白,为中文拼写自动纠正的后续研究奠定了基础。

    一种基于近邻保持典型相关分析的人脸识别方法

    公开(公告)号:CN111611963A

    公开(公告)日:2020-09-01

    申请号:CN202010473892.2

    申请日:2020-05-29

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于近邻保持典型相关分析的人脸识别方法,其包括以下步骤:1:输入人脸训练数据集X∈Rm×N,Y∈Rn×N,通过近邻保持学习计算图像的近邻权重重建矩阵Ux和Uy;2:采用典型相关分析寻找两组投影向量wx和wy,用最优化方法将近邻保持引入典型相关分析的框架之中,利用广义特征值分解计算投影矩阵Wx和Wy;3:采用两种特征融合策略对测试人脸图像的低维投影和 进行融合;4:利用最近邻分类器将融合后的特征用于人脸识别。本发明通过近邻保持学习人脸邻近权重重建矩阵,用最优化方法将近邻保持引入典型相关分析框架中,再利用人脸的标签信息,这样提取出的人脸特征不仅最大化了不同人脸间的相关性,而且还最大可能地保持了人脸的邻域结构,提高了人脸识别能力和稳定性。

Patent Agency Ranking