Patent search ap:("河南科技大学") AND inv:"梁晗" Page 1

1.

发明公开
一种融合空域纹理差异和频域信息的深度伪造检测方法审中-实审

公开(公告)号：CN118968269A

公开(公告)日：2024-11-15

申请号：CN202411041806.5

申请日：2024-07-31

Applicant: 河南科技大学

Inventor： 张志勇 , 方帅举 , 宋斌 , 梁晗 , 李玉祥 , 张中亚 , 张丽丽 , 赵长伟 , 于雅洁

IPC: G06V20/00 , G06V40/16 , G06V10/80 , G06V10/54

Abstract: 本发明公开了一种融合空域纹理差异和频域信息的深度伪造检测方法，该方法首先对输入图像进行预处理得到人脸图像；其次分别将人脸图像输入上分支网络、下分支网络以提取伪造图像空域中的纹理差异信息、频域潜在伪影信息，并输出特征图；然后特征图投影为特征块并与CLS令牌拼接，输出特征向量作为特征融合模块的输入，得到经过特征融合后的CLS_S令牌与CLS_F令牌；最后将CLS_S令牌与CLS_F令牌作为多层感知器的输入获得分类结果并输出。本发明结合空域纹理差异和频域信息做为分类依据，经过交叉注意力机制进行特征融合后对真伪图像进行分类，具有更优的检测性能和泛化能力。

2.

发明公开
一种视听事件定位方法和计算机设备审中-公开

公开(公告)号：CN120032297A

公开(公告)日：2025-05-23

申请号：CN202510119534.4

申请日：2025-01-24

Applicant: 河南科技大学

Inventor： 梁晗 , 张志勇 , 陈进才 , 张中亚 , 宋斌 , 孙超

IPC: G06V20/40 , G06V10/22 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08

Abstract: 本发明属于视听事件定位技术领域，具体涉及一种视听事件定位方法和计算机设备。将一段视频的视觉、音频数据输入至训练后的视听事件定位模型，得到视听事件定位结果；其中，视听事件定位模型包括单模态特征提取模块、多模态协同状态空间模块、特征融合模块、多模态增强状态空间模块和事件预测模块。其中的多模态协同状态空间模块可以学习视听模态间共享的全局上下文信息和各模态特定的特征信息，多模态增强状态空间模块可以学习特征融合结果的全局上下文信息。本发明可以实现视觉与音频模态的高效融合，优化细粒度信息的挖掘，提升了视听事件定位任务的整体性能。

3.

发明公开
一种新型中文语义混淆越狱攻击方法、装置、介质及设备审中-公开

公开(公告)号：CN120012052A

公开(公告)日：2025-05-16

申请号：CN202510146019.5

申请日：2025-02-10

Applicant: 河南科技大学

Inventor： 张志勇 , 岳欣馨 , 宋斌 , 梁晗 , 李玉祥 , 张中亚 , 张丽丽 , 赵长伟 , 于雅洁

IPC: G06F21/14 , G06N5/04

Abstract: 一种新型中文语义混淆越狱攻击方法、装置、介质及设备，方法包括：获取原始有害提示；识别敏感有害关键词；选择与敏感有害关键词概率距离最大的同音异形词作为替代词；构造师生场景，目标模型作为学生回答原始有害提示；在师生场景中融合前缀注入和拒绝抑制；在师生场景中添加单样本；将原始有害提示和单样本中所有的敏感关键词替换为对应的同音异形词；将融合前缀注入和拒绝抑制的师生场景、替换完成的原始有害提示、替换完成的单样本作为目标模型的输入。实现针对国产大模型的自动化黑盒越狱攻击，能够有效地评估和测试中文语境下LLMs对于中文语义混淆越狱的抵抗能力，助于研究和开发更精准的防御措施。

Patent Agency Ranking