-
公开(公告)号:CN119917667A
公开(公告)日:2025-05-02
申请号:CN202510085413.2
申请日:2025-01-20
Applicant: 扬州大学
IPC: G06F16/353 , G06F40/253 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/0442 , G06F40/284 , G06F40/268 , G06F18/22 , G06N3/0895
Abstract: 本发明公开了两阶段知识驱动提示调优的中文隐性仇恨语言检测方法,包括1)使用结合注意力机制的图卷积网络提取输入文本的语法结构特征;2)在连续的最优提示空间中进行训练,得到软提示模板;3)通过融合外部知识的方法构建扩展词映射器,并采用两阶段串联策略进行扩展与细化,生成优化后的扩展词映射器;4)从训练集中选取少量样本进行训练构造提示调优模型,结合软提示模板与扩展词映射器提取语义特征,将其与生成的语法结构特征拼接形成综合特征,实现中文隐性仇恨语言检测。本发明通过外部知识优化串联扩展与细化的扩展词映射器,融合注意力机制与图卷积网络提取的语法特征,挖掘预训练语言模型的潜在知识,高中文隐性仇恨语言检测效果。
-
公开(公告)号:CN119849444A
公开(公告)日:2025-04-18
申请号:CN202411750813.2
申请日:2024-12-02
Applicant: 扬州大学
IPC: G06F40/166 , G06F40/216
Abstract: 本发明公开了一种基于多智能体大模型的长文档简化方法,包括1)划分模拟人类专家团队的角色分配并借助角色扮演提示模板驱动大语言模型实现不同的角色分工;2)对原始文档进行整体规划,产生对后续的各项简化工作有全局指导性的信息;3)针对原始文档进行初步的简化和迭代优化;4)在初步简化的基础上进行更加细致的简化;5)将经过了多重简化操作的多个简化片段重构为整篇简化文章并进行修订;6)基于生成的平行语料微调开源模型,提高文档简化能力。本发明通过多智能体协作、提示工程以及层次化简化策略,解决了现有文档简化技术中存在的语法错误、语义偏差以及长文档处理逻辑混乱等问题,提高了文档简化的准确性、流畅性和信息完整性。
-
公开(公告)号:CN118885669A
公开(公告)日:2024-11-01
申请号:CN202411056779.9
申请日:2024-08-02
Applicant: 扬州大学
IPC: G06F16/9535 , G06F16/35 , G06F16/34 , G06F40/186 , G06N3/045 , G06N3/0442 , G06F40/216 , G06F40/194
Abstract: 本发明公开了一种基于软提示调优的个性化新闻推荐方法,包括1)对每个用户进行建模,引入新闻的附加侧边信息,包括新闻的子类别和摘要,以丰富新闻的特征表示;2)选择合适的预训练语言模型,将训练模型作为主干,构建提示学习中的标签词和模板;3)通过三种优化策略扩展标签词映射器,得到优化后的标签词集;4)在通过各种策略成功构建最终的标签词映射器之后,将每个标签词的预测概率适当地映射到它们各自的类别中。本发明针对个性化新闻推荐的特殊需求对模型进行了优化,能够充分提取新闻文本特征,显著提升了推荐的准确性。通过提示学习结合预训练语言模型,显著减少了额外的噪声,并实现更准确的推荐结果。
-
公开(公告)号:CN111242082B
公开(公告)日:2023-10-13
申请号:CN202010069619.3
申请日:2020-01-21
Applicant: 扬州大学
IPC: G06V40/16 , G06V10/77 , G06V10/774 , G06T3/40
Abstract: 本发明公开了基于分数阶正交偏最小二乘的人脸超分辨率重建识别方法,包括以下步骤:1利用分数阶正交偏最小二乘,将组内和组间协方差矩阵通过分数阶特征值和奇异值重新调整,再计算投影方向,将人脸图像特征映射到子空间中,通过邻域重建的思想重建出低分辨率输入高分辨率全局脸特征;2利用邻域重建方法构造高分辨率人脸残差块,将残差块合成得到高分辨率人脸残余补偿,通过残差补偿策略补充人脸细节;3最终算法输出的高分辨率人脸图像为全局人脸加上残差补偿,其中高分辨率全局脸特征可用于人脸识别。本发明在人脸超分辨率重建与识别应用中,能够获得更好的人脸重建效果和更高的人脸识别准确率。
-
公开(公告)号:CN111275624B
公开(公告)日:2023-08-08
申请号:CN202010069717.7
申请日:2020-01-21
Applicant: 扬州大学
Abstract: 本发明公开了基于多集典型相关分析的人脸图像超分辨率重建识别方法,包括以下步骤:1利用多集典型相关分析,可以同时为同源的各种低分辨率人脸视图学习多种特定分辨率的映射,将多视图人脸图像分成重叠的图像块,再利用多集典型相关分析提取图像块主成分的潜在相干特征;2利用邻域重建策略重建出全局人脸图像,再通过残差补偿对全局人脸图像补充细节;3最终输出的超分辨率重建结果为全局人脸图像加上残差人脸图像。本发明具有一定的理论基础,在不同数据库下测试结果表明本发明具有较强的鲁棒性,具有一定的市场实施的可行性,解决了目前绝大多数现有算法无法处理的多视图超分辨率问题,具有较大的创新性与实用性。
-
公开(公告)号:CN111652695B
公开(公告)日:2023-05-30
申请号:CN202010529350.2
申请日:2020-06-11
Applicant: 扬州大学
IPC: G06Q30/0601 , G06Q30/0202 , G06N3/0455 , G06N3/08
-
公开(公告)号:CN112949718A
公开(公告)日:2021-06-11
申请号:CN202110235176.5
申请日:2021-03-03
Applicant: 扬州大学
IPC: G06K9/62
Abstract: 本发明公开了一种半配对多视图邻域相关分析方法,包括1)利用k邻域和径向基函数计算视图内样本的相似度矩阵;2)利用视图间样本共享的配对样本和视图内样本的相似度矩阵,计算不同视图间样本的相似度矩阵;3)构建半配对多视图邻域相关分析的最优化模型,并利用拉格朗日乘子法将其转化成广义特征值问题;4)求解广义特征值问题;5)使用每个视图的投影矩阵,分别对训练样本和测试样本进行降维,获取其低维表示;6)使用k近邻分类器对降维后的测试数据进行识别,并计算识别率。本发明不仅能够揭示配对多视图样本间的相关性,而且还能有效地利用大量未配对样本所蕴含的信息,因此可以有效缓解因配对样本数量有限所导致的过拟合现象。
-
公开(公告)号:CN111651588A
公开(公告)日:2020-09-11
申请号:CN202010522574.0
申请日:2020-06-10
Applicant: 扬州大学
IPC: G06F16/34 , G06F40/216 , G06F40/289 , G06K9/62
Abstract: 本发明公开了一种基于有向图的文章摘要信息提取算法,包括以下步骤:1输入需要提取出主要信息的文章,去除无效标记,对文章的每个句子做分词处理,并去除句子中的停用词;2分别计算文章的每个词汇的词频与逆文本频率指数,并计算每个词汇的词频逆文本频率值,然后对所有词汇的词频逆文本频率值进行过滤;3将文章所有句子视为图的节点构建无向图,计算文章中任意两个句子的相似程度,构建邻接矩阵对其进行降噪操作,计算文章集合中每一个句子的邻接度;4进行迭代计算得出每一个句子的中心度;5根据使用者需求,选择最高中心度的一个或一组句子作为文章的摘要;本发明使得提取出的文章摘要准确性更高,大大提高了使用者的阅读效率。
-
公开(公告)号:CN111292237A
公开(公告)日:2020-06-16
申请号:CN202010069628.2
申请日:2020-01-21
Applicant: 扬州大学
IPC: G06T3/40
Abstract: 本发明公开了基于二维多集偏最小二乘的人脸图像超分辨率重建方法,包括以下步骤,1人脸图像首先被分为多个重叠的图像块,再利用二维多集偏最小二乘方法提取二维人脸图像块的潜在特征;2利用邻域重建策略以及图像块合并对输入的低分辨率人脸图像进行高频人脸图像重建;3最终输出的超分辨率重建图像为重建出的高频图像加上输入的低分辨率人脸图像。本发明具有一定的理论基础,创新性地提出了二维多集偏最小二乘方法,在不同数据库下测试结果表明具有较强的鲁棒性,有一定的市场实施的可行性,解决了目前绝大多数现有算法无法处理的多视图超分辨率问题,具有较大的创新性与实用性。
-
公开(公告)号:CN114817550B
公开(公告)日:2024-11-15
申请号:CN202210555187.6
申请日:2022-05-19
Applicant: 扬州大学
IPC: G06F16/35 , G06F40/30 , G06F18/2415 , G06N3/0455 , G06N3/096
Abstract: 本发明公开了一种基于提示学习的领域自适应方法,包括以下步骤:1)选择Bert模型,将该预训练语言模型作为主干,对提示学习方法中的模板和标签词进行设置;2)构造出所需要的提示学习模型,对于数据集,运用提示学习数据加载函数对数据进行加载和处理,之后进行领域自适应任务;3)随机选取少量源域数据样本进行训练,之后将目标域的句子嵌入到同样的模板中,通过预训练语言模型进行掩码语言建模,对输入的目标域句子进行分类预测。本发明利用提示学习的方法,可以解决源域和目标域中语义特征结构的扭曲和类别可辨别性的丢失,在少量源域数据样本的前提下,能够在目标域分类任务中达到更好的准确度。
-
-
-
-
-
-
-
-
-