-
公开(公告)号:CN116630754A
公开(公告)日:2023-08-22
申请号:CN202310360864.3
申请日:2023-04-06
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/80 , G06V10/764 , G06V10/40 , G06N3/0464 , G06N3/08
Abstract: 本申请提供显著区域推断方法和系统,涉及目标检测的技术领域。在该方法中,服务器获取待检测图片的基础特征图;服务器根据多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图;服务器将所述多尺度特征图输入至自适应特征融合网络中,得到所述待检测图片的显著区域,以完成对所述待检测图片的显著区域推断。实施本申请提供的技术方案,具有提高图片显著区域的推断准确性的效果。
-
公开(公告)号:CN116630841A
公开(公告)日:2023-08-22
申请号:CN202310366264.8
申请日:2023-04-06
Applicant: 喀什地区电子信息产业技术研究院
Abstract: 一种基于注意力的目标检测方法和系统,涉及行人身份识别领域领域。在该方法中,包括以下步骤:获取待检测视频;通过第一特征网络对待检测视频包含的待检测视频帧进行处理,生成待检测视频的特征表示,所述第一特征网络包括简化ResNet底部网络以及空间金字塔顶部网络,简化ResNet底部网络用于提取待检测视频帧的多维视频帧特征,空间金字塔顶部网络用于对待检测视频帧的多维视频帧特征进行融合处理,生成所述待检测视频帧的特征表示;根据全部待检测视频帧的特征表示,在待检测视频中生成目标检测结果。通过采用本申请提供的技术方案,简化第一特征网络的结构,减少第一特征网络的参数数量,从而提升行人检测方法的检测速度。
-
公开(公告)号:CN116403081A
公开(公告)日:2023-07-07
申请号:CN202310359590.6
申请日:2023-04-06
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/80 , G06V10/82 , G06V10/774
Abstract: 本发明涉及目标检测技术领域,特别是涉及一种双向自适应特征融合的多尺度检测方法,采取骨干网络的C2、C3、C4、C5层输出的不同尺度的特征图以及C5层经过一个卷积下采样后得到特征图;将这些特征图分别经过一个1×1卷积核,将通道数统一为256,得到输入特征图;将输入特征图进行双向特征融合,得到不同层特征图;将不同层特征图中相邻三层特征图变换为同一尺度;将相邻三层特征图进行加权融合,输出大、中、小三种尺度的特征图;在不同尺度的特征图上对多尺度目标进行检测。通过本检测方法,能够从两种方向对不同尺度特征图进行融合,平衡不同尺度特征图之间的信息,能有效解决多尺度特征相互干扰的问题。
-
公开(公告)号:CN116797962A
公开(公告)日:2023-09-22
申请号:CN202310359179.9
申请日:2023-04-04
Applicant: 喀什地区电子信息产业技术研究院
Abstract: 一种基于相似特征跨域融合的目标检测方法和系统,涉及及目标检测技术领域。该方法包括:获取目标视频中的难例目标;获取所述难例目标的局部定位信息和全局语义信息;提取所述全局语义信息和所述局部定位信息的相似特征;基于所述相似特征对所述全局语义信息和所述局部定位信息进行跨域融合,得到特征融合信息;构建长记忆网络,并基于所述长记忆网络以及所述特征融合信息,对所述难例目标进行检测。实施本申请提供的技术方案,提升在复杂场景下难例目标的检测速度和准确性。
-
公开(公告)号:CN116612405A
公开(公告)日:2023-08-18
申请号:CN202310359171.2
申请日:2023-04-04
Applicant: 喀什地区电子信息产业技术研究院
Abstract: 本申请提供视频热区先验预测方法和系统。方法包括:将待处理视频转换成多个视频帧;对第一视频帧进行切割处理,得到多个图像块,第一视频帧为多个视频帧中的任意一个;对第一图像块进行展平和线性变换,得到第一特征向量,第一图像块为多个图像块中的任意一个;对第一特征向量添加位置信息,得到第一输入向量;将多个第一输入向量按照预设方式进行拼接,得到第一向量组;基于向量组,计算任意两个相邻的第一输入向量的相关度值;判断相关度值与预设的第一阈值的大小关系,若判断出相关度值小于或等于第一阈值,则确定对应的视频区域为视频热区。通过对视频帧进行切分处理,并在后续进行相应地处理,从而达到提高视频热区预测的准确性的效果。
-
-
-
-