-
公开(公告)号:CN119180810A
公开(公告)日:2024-12-24
申请号:CN202411412118.5
申请日:2024-10-11
Applicant: 河北工业大学
IPC: G06T7/00 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06T7/194 , G06T3/4038 , G06V10/74 , G06T5/10 , G06V10/44 , G06V10/80
Abstract: 本发明为基于前背景联调和边缘引导的多篡改定位方法,所述定位方法包括以下内容:获取多操作图像数据集,每个图像包含至少两种篡改类型,篡改类型包括拼接、复制‑移动和删除;构建多篡改定位模型,所述多篡改定位模型包括由Res2net网络和连接在Res2net网络的每个尺度输出上的残差网络构成的骨干网络、边缘辅助的细化融合模块;利用多操作图像数据集训练多篡改定位模型,以训练后的多篡改定位模型用于图像中不同类型篡改区域的定位。解决了如何精准定位图像中的多个篡改区域的问题,实现了一张图片多个篡改类型的精确定位。
-
公开(公告)号:CN118410130B
公开(公告)日:2024-09-24
申请号:CN202410850693.7
申请日:2024-06-28
Applicant: 河北工业大学
IPC: G06F16/33 , G06N3/0464 , G06N3/088 , G06N5/02 , G06N5/04 , G06F16/332 , G06F18/213 , G06F18/2415
Abstract: 本申请提供了一种基于知识图谱的预训练语言模型构建方法,包括:基于预训练语言的语义解析模型对输入的自然语言问题进行数据处理,得到候选逻辑形式列表,其中,语义解析模型用以提取所述自然语言问题特征,并进行问句的实体识别和意图识别,结合实体和意图并经逻辑转换填充生成候选逻辑形式列表;基于无监督多阶段搜索算法在知识图谱中对生成的候选逻辑形式列表进行知识检索,结合检索结果更新逻辑形式内容并转换成Cypher语句进行图谱查询,返回答案列表形成答案集。本申请不仅提高了智能问答效率和服务水平,而且为未来的注入医疗、法律、人文等多个专业领域的可解释知识推理问答提供了新的解决思路。
-
公开(公告)号:CN113888399B
公开(公告)日:2024-04-16
申请号:CN202111240317.9
申请日:2021-10-25
Applicant: 河北工业大学
IPC: G06T3/04 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/084 , G06T3/02
Abstract: 本发明为一种基于风格融合与域选结构的人脸年龄合成的方法,该方法包括以下内容:对人脸公开数据集进行预处理,每个人脸样本对应一个年龄标签,设置年龄域的数量;构建风格融合和多域判别的对抗网络,包括基于风格融合的生成器网络和域选判别器网络;域选判别器网络包括多个域选结构和一个全连接层,域选结构由两种类型的函数组成:基础函数和多个域函数;针对每一批次的输入图像只用基础函数和一个特定的域函数提取特征,其中域函数的个数与年龄域的个数保持一致。本发明能够有效地解决人脸身份信息丢失和训练不稳定的问题。
-
公开(公告)号:CN115410223A
公开(公告)日:2022-11-29
申请号:CN202210991899.2
申请日:2022-08-17
Applicant: 河北工业大学
IPC: G06V40/10 , G06V10/40 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明为一种基于不变性特征提取的领域泛化行人重识别方法,该方法包括以下内容:构建识别模型,所述识别模型以ResNet50网络为主干网络,还包括注意力感知的不变性特征提取模块,所述ResNet50网络具有依次串联的N个残差单元,在前N‑1个残差单元的输出处均连接一个注意力感知的不变性特征提取模块,最后一个残差单元的输出不接注意力感知的不变性特征提取模块,最后一个残差单元的输出连接平均池化层、批量归一化层和全连接层;所述注意力感知的不变性特征提取模块用于提取领域不变特征,包括:实例归一化层、分组白化层、空间注意力和通道注意力。该方法对所有源域统一进行处理,减少了模型参数,避免了采用领域专家方式对相对应源域的过拟合。
-
公开(公告)号:CN119580306A
公开(公告)日:2025-03-07
申请号:CN202411707851.X
申请日:2024-11-27
Applicant: 河北工业大学
IPC: G06V40/10 , G06V20/52 , G06V10/26 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/77 , G06V10/82 , G06T3/4053 , G06N3/0464 , G06N3/047 , G06N3/094 , G06N3/048 , G06N3/0895
Abstract: 本发明为一种多相关的行人属性识别方法,包括以下内容:获取行人图片并预处理;构建多相关的行人属性识别模型:多相关的行人属性识别模型包括超分辨率结构校准模块、区域相关因果对象感知模块、空间属性相关感知模块;超分辨率结构校准模块包括预训练的VIT视觉编码器、全局超分辨率模块GSR,全局超分辨率模块GSR的输出再经过预训练的VIT视觉编码器处理后获得超分辨率结构校准模块的输出#imgabs0#;使用多项式对比损失函数训练多相关的行人属性识别模型,进行行人属性识别。本发明在统一模型框架中充分集成超分辨率提升、区域相关性、属性相关性等模块,利用对比学习的互相指导训练,考虑了行人图像的质量问题及属性不平衡问题。
-
公开(公告)号:CN116434010A
公开(公告)日:2023-07-14
申请号:CN202310423403.6
申请日:2023-04-20
Applicant: 河北工业大学
IPC: G06V10/774 , G06V10/74 , G06V10/762 , G06V10/82 , G06V10/764 , G06N3/0464
Abstract: 本发明为一种多视图的行人属性识别方法,从语义相关性、区域相关性以及语义区域之间的相关性三个视图识别属性,使用语义图卷积学习语义相关性,使用视觉图卷积学习区域相关性,联合语义关联图和视觉关联图构建合成图,通过合成图图卷积来学习语义与区域相关性,利用融合两图特征信息的嵌入图间边预测属性。对于损失函数而言,传统的方法都对所有数据集采用相同的加权策略,导致在某个数据集上的权重过重和过轻,本方法对不同的数据集采用不同的损失函数加权方式,对不同的数据集有效地缓解属性不平衡问题。
-
公开(公告)号:CN115546461A
公开(公告)日:2022-12-30
申请号:CN202211331208.2
申请日:2022-10-28
Applicant: 河北工业大学
Abstract: 本发明为一种基于掩膜去噪和特征选择的人脸属性编辑方法,该方法针对人脸属性编辑,设计的掩膜去噪模块能够在生成注意力掩膜的时候只生成与要更改属性有关的掩膜,而去除掉一些包含人脸信息的背景掩膜,能够很好的完成属性编辑的任务并同时保留非编辑区域的一致性;设计的特征选择单元能够在特征层面上筛选图像的特征,保留因为网络深度而回丢失的与属性无关的特征,并在解码过程中根据二进制属性向量经由属性编码器丰富信息后的属性风格码进行特征的风格融合;采用的预训练篡改检测模型能够更好的检测生成图像是否经过篡改,提升了模型生成图像的伪真性。
-
公开(公告)号:CN113782190A
公开(公告)日:2021-12-10
申请号:CN202111104505.9
申请日:2021-09-22
Applicant: 河北工业大学
Abstract: 本发明为基于多级时空特征和混合注意力网络的抑郁症诊断方法,该方法包括以下内容:经过预处理的公开数据集变为成组的大小固定的图片,每个图片组对应一个视频序列,并对应一个抑郁分数;构建多级时空特征和混合注意力网络:以3D‑Resnet50网络相邻两层的输出作为输入,接入多级时空特征融合模块;所述多级时空特征融合模块包括时空特征调制子模块和特征融合子模块,时空特征调制子模块用于分别对相邻两层的输出都进行空间和时间调制;特征融合子模块用于对两个调制后的特征进行特征融合;多级时空特征经调整后连接一个混合注意力模块。该方法有效克服了单一网络深度在时间感受野和空间感受野局限的问题,实现针对抑郁患者的抑郁分数评估。
-
公开(公告)号:CN119180810B
公开(公告)日:2025-02-28
申请号:CN202411412118.5
申请日:2024-10-11
Applicant: 河北工业大学
IPC: G06T7/00 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06T7/194 , G06T3/4038 , G06V10/74 , G06T5/10 , G06V10/44 , G06V10/80
Abstract: 本发明为基于前背景联调和边缘引导的多篡改定位方法,所述定位方法包括以下内容:获取多操作图像数据集,每个图像包含至少两种篡改类型,篡改类型包括拼接、复制‑移动和删除;构建多篡改定位模型,所述多篡改定位模型包括由Res2net网络和连接在Res2net网络的每个尺度输出上的残差网络构成的骨干网络、边缘辅助的细化融合模块;利用多操作图像数据集训练多篡改定位模型,以训练后的多篡改定位模型用于图像中不同类型篡改区域的定位。解决了如何精准定位图像中的多个篡改区域的问题,实现了一张图片多个篡改类型的精确定位。
-
公开(公告)号:CN113782190B
公开(公告)日:2023-12-15
申请号:CN202111104505.9
申请日:2021-09-22
Applicant: 河北工业大学
IPC: G16H50/20 , G06V10/764 , G06V40/16 , G06V10/82 , G06N3/0464 , G06V20/40
Abstract: 本发明为基于多级时空特征和混合注意力网络的抑郁症诊断方法,该方法包括以下内容:经过预处理的公开数据集变为成组的大小固定的图片,每个图片组对应一个视频序列,并对应一个抑郁分数;构建多级时空特征和混合注意力网络:以3D‑Resnet50网络相邻两层的输出作为输入,接入多级时空特征融合模块;所述多级时空特征融合模块包括时空特征调制子模块和特征融合子模块,时空特征调制子模块用于分别对相邻两层的输出都进行空间和时间调制;特征融合子模块用于对两个调制后的特征进行特征融合;多级时空特征经调整后连接一个混合注意力模块。该方法有效克服了单一网络深度在时间感受野和空间感受野局限的问题,实现针对抑郁患者的抑郁分数评估。
-
-
-
-
-
-
-
-
-