-
公开(公告)号:CN106503723A
公开(公告)日:2017-03-15
申请号:CN201510559904.2
申请日:2015-09-06
IPC: G06K9/62
CPC classification number: G06K9/6223
Abstract: 本发明实施例公开了一种视频分类方法,用于解决现有技术中不能准确将视频进行分类的缺陷,提高视频分类的准确度。本发明实施例方法包括:获取视频中的信息,所述视频中的信息包括图像信息,光流信息以及声音信息;利用深度神经网络生成所述图像信息对应的第一参考信息、所述光流信息对应的第二参考信息以及所述声音信息对应的第三参考信息;根据所述第一参考信息、第二参考信息以及所述第三参考信息对所述视频进行处理以获取所述视频的置信度矩阵和所述视频的类别关系矩阵;将所述视频的置信度矩阵和所述视频的类别关系矩阵代入目标函数,以获取所述视频的目标融合参数,所述目标融合参数用于对视频进行分类。
-
公开(公告)号:CN104331442A
公开(公告)日:2015-02-04
申请号:CN201410580006.0
申请日:2014-10-24
CPC classification number: G06K9/6271 , G06F17/16 , G06F17/30781 , G06K9/00718 , G06K9/6215 , G06K9/629 , G06N3/04 , G06N3/08 , G06F17/30784 , G06F17/30787 , G06F17/30799 , G06F17/30811 , G06F17/30828
Abstract: 本发明实施例提供一种视频分类方法和装置,通过根据视频样本的特征之间的关系和语义之间的关系建立神经网络分类模型;获取待分类的视频文件的特征组合;采用所述神经网络分类模型和所述待分类的视频文件的特征组合,对所述待分类的视频文件进行分类。由于神经网络分类模型是根据视频样本的特征之间的关系和语义之间的关系建立的,充分考虑了特征之间的关系和语义之间的关系,因此,可以提高视频分类的准确性。
-
公开(公告)号:CN119603452A
公开(公告)日:2025-03-11
申请号:CN202311162817.4
申请日:2023-09-08
IPC: H04N19/184 , H04N19/436 , H04N19/132
Abstract: 本申请实施例提供一种分布式解码方法及相关装置,该方法包括:接收比特流,其中,所述比特流包括针对输入图像的灰度信息的编码结果;根据所述比特流重建所述输入图像的灰度信息;根据重建的所述输入图像的灰度信息和相关图像确定所述输入图像与所述相关图像间的光流,所述相关图像为与所述输入图像存在关联关系的图像;通过所述光流对所述相关图像进行采样得到采样图像;根据所述采样图像和重建的所述输入图像的灰度信息重建所述输入图像。采用本申请实施例,能够提高输入图像的重建质量。
-
公开(公告)号:CN119380111A
公开(公告)日:2025-01-28
申请号:CN202411618426.3
申请日:2024-11-13
Applicant: 复旦大学
IPC: G06V10/764 , G06V10/25 , G06V10/774 , G06V10/26 , G06T3/40 , G06V10/22 , G06N3/084 , G06V10/82
Abstract: 本发明提供了一种基于扩散模型的可定制物理对抗补丁生成方法,属于人工智能安全领域,本发明通过在物体表面生成自然且不易察觉的对抗补丁,欺骗目标检测系统,躲避识别。本发明专门用于创建自然和可定制的对抗性补丁。本发明利用参考图像代替传统的随机噪声作为补丁生成的基础,确保补丁在视觉上与自然图像保持高度一致。通过引入不完全扩散优化策略,补丁生成过程更加高效,同时有效保持了攻击性能。本发明使用了掩码技术,使得生成的对抗补丁可以是多种形状,不再局限于传统的方形补丁。本发明提出的对抗补丁在保持自然外观的同时,具备与现有非自然对抗补丁方法相当甚至更高的攻击成功率。
-
公开(公告)号:CN119378604A
公开(公告)日:2025-01-28
申请号:CN202411612396.5
申请日:2024-11-13
Applicant: 复旦大学
IPC: G06N3/045 , G06F18/214 , G06F17/16 , G06N3/08 , G06N5/04
Abstract: 本发明提供了一种深度学习模型性能分级方法及分级模型使用方法,具有这样的特征,包括步骤S1,构建多个重排密钥矩阵;步骤S2,选取一批训练数据输入深度学习模型;步骤S3,对每个训练数据,随机选取一个重排密钥矩阵作为对应的列重排矩阵;步骤S4~S6,对每个训练数据,根据对应的词元矩阵和列重排矩阵,经由深度学习模型处理,得到对应的最终输出;步骤S7,根据所有最终输出计算损失进而优化深度学习模型;步骤S8,重复执行步骤S2至步骤S7,直至深度学习模型收敛,则得到分级模型。总之,本方法能够分级调控用户使用的模型的推理性能。
-
公开(公告)号:CN118521877A
公开(公告)日:2024-08-20
申请号:CN202410604946.2
申请日:2024-05-15
Applicant: 复旦大学
IPC: G06V20/00 , G06V10/774 , G06V10/764 , G06V10/82 , G06N5/04 , G06N3/084 , G06N3/045 , G06N3/0464
Abstract: 本发明提供了一种深度学习模型锁方法及图像推理装置,具有这样的特征,包括以下步骤:步骤S1,将所有原始训练图像中a%的原始训练图像分别通过极度非线性的文本条件引导的扩散模型进行数据编辑,得到对应的编辑训练图像;步骤S2,将所有原始训练图像中剩余的(100‑a)%的原始训练图像对应的原始标签分别修改为错误标签;步骤S3,将所有编辑训练图像及其对应的原始标签,以及所有错误标签及其对应的原始训练图像作为训练数据集;步骤S4,根据训练数据集对预训练模型进行微调,得到训练好的预训练模型作为上锁模型。总之,本方法能够有效地在训练阶段保护原始数据,并在使用阶段防止上锁模型被未经许可的使用。
-
公开(公告)号:CN117675100A
公开(公告)日:2024-03-08
申请号:CN202211095937.2
申请日:2022-09-08
IPC: H04L1/00
Abstract: 本申请提供一种数据处理方法及相关设备。可以应用于信源信道联合编码场景。该方法包括:获取第一数据;获取失真度信息,失真度信息用于指示信道的质量情况;将第一数据与失真度信息输入编码器以得到码流;基于码流与失真度信息获取边信息,边信息用于指示码流的信号强弱;基于边信息与失真度信息对码流进行筛选以得到模拟系数,模拟系数用于指示信号强弱对应的数值;通过信道将模拟系数以及编码后的边信息发送给第二设备。通过引入用于指示信息质量情况的失真度信息,可以对码流进行筛选,以实现联合编码过程中对信道质量的自适应。另外,还可以通过传输编码后的边信息辅助解码端进行数据重建。
-
公开(公告)号:CN117671754A
公开(公告)日:2024-03-08
申请号:CN202311249422.8
申请日:2023-09-26
Applicant: 复旦大学
IPC: G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明属于计算机技术领域,具体为基于不确定建模的人脸伪造检测系统。本发明系统包括概率性Transformer模块、图像块筛选模块和不确定性感知的单分类损失函数模块。本发明先将图像块之间的依赖关系建模为高斯随机变量,以概率的方式扩展Transformer模型,然后引入了图像块选择模块,识别出具有高不确定性信息的区域用于最终分类;最后,量化整个图像的不确定性,使用设计的不确定性感知的单分类损失函数,使模型更专注于那些不确定性较高、难以判定的样本,通过只增强真实面部的内部紧凑性,在嵌入空间中提高真实类和虚假类的类间可分性。
-
公开(公告)号:CN116721333A
公开(公告)日:2023-09-08
申请号:CN202310759766.7
申请日:2023-06-26
Applicant: 复旦大学
IPC: G06V10/82 , G06V10/764 , G06V20/40 , G06V10/44 , G06N3/0475 , G06N3/094 , G06N3/045
Abstract: 本发明属于视频识别网络模型安全技术领域,具体为一种从图像域迁移到视频域的生成式跨模态攻击方法。本发明仅利用图像域的知识训练对抗扰动生成器,训练好的对抗扰动生成器用于为来自不同视频域的视频逐帧生成对于不同视频模型具有较高迁移性的对抗扰动;其中,通过缩小图像和视频之间的域差异增强从图像域到视频域的对抗迁移性;设计一个随机运动模块,通过随机合成的光流来模拟相邻视频帧之间不同的时序运动;通过在特征破坏损失中集成随机运动模块;在训练阶段引入额外的时序线索、基于中间特征的时序一致性损失,增强生成视频对抗样本的迁移性;实验证明本发明攻击方法的有效性,并且在不同的目标视频域上有最先进的性能。
-
公开(公告)号:CN116612021A
公开(公告)日:2023-08-18
申请号:CN202310492353.7
申请日:2023-05-05
Applicant: 复旦大学
IPC: G06T5/00 , G06T3/60 , G06T3/40 , G06V10/40 , G06V10/762 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0442 , G06N3/0455 , G06N3/088
Abstract: 本发明属于图像智能分析领域,具体为一种基于自监督排序学习的图像去冗余方法。本发明将图像切分为不相交的小图像块集合,进而提出基于图像块推理重建质量的伪标签生成方法,以及基于此的图像块重要性排序建模及冗余内容识别。基于此,本发明的图像识别等下游任务可以仅在依据排序模型选择得到的重要图像块而不是全部图像内容上进行。本发明可以在保持识别精度的情况下,大幅降低当前具备识别优势的视觉自注意模型的计算代价。此外,该方法突破了传统有监督图像冗余内容识别方法会带来归纳偏差的不足,具有更好的通用性,并在相同的去冗余比例下具有更高的识别精度。
-
-
-
-
-
-
-
-
-