-
公开(公告)号:CN110348437B
公开(公告)日:2022-03-25
申请号:CN201910567434.2
申请日:2019-06-27
Applicant: 电子科技大学
IPC: G06V10/25 , G06V10/764 , G06V10/80 , G06K9/62
Abstract: 本发明公开了一种基于弱监督学习与遮挡感知的目标检测方法,先对图片进行多层特征融合,得到包含更多信息和细节的特征图,并结合特征图提取上下文信息块;再通过弱监督方法来定位判别性区域,并利用含有丰富信息的特征图遮挡目标的判别性区域来生成难例样本,最后基于难例样本和上下文信息块进行模型训练和目标检测。
-
公开(公告)号:CN110348447B
公开(公告)日:2022-04-19
申请号:CN201910567433.8
申请日:2019-06-27
Applicant: 电子科技大学
Abstract: 本发明公开了一种具有丰富空间信息的多模型集成目标检测方法,将单级框架、上下文建模和多尺度表示相结合,集成用于目标检测的网络模型,具体讲,我们采用了一种新的上下文建模方法,将语义分割领域中常用的空洞卷积应用到目标检测中,利用空洞卷积能够在不增加计算量的情况下扩展接收野的特性,从而构建了上下文检测模块;同时,我们还通过多尺度表示捕获细粒度的细节,以增强模型的表示能力;结合了集成学习的思想,进一步提高了检测器的性能。
-
公开(公告)号:CN110348447A
公开(公告)日:2019-10-18
申请号:CN201910567433.8
申请日:2019-06-27
Applicant: 电子科技大学
Abstract: 本发明公开了一种具有丰富空间信息的多模型集成目标检测方法,将单级框架、上下文建模和多尺度表示相结合,集成用于目标检测的网络模型,具体讲,我们采用了一种新的上下文建模方法,将语义分割领域中常用的空洞卷积应用到目标检测中,利用空洞卷积能够在不增加计算量的情况下扩展接收野的特性,从而构建了上下文检测模块;同时,我们还通过多尺度表示捕获细粒度的细节,以增强模型的表示能力;结合了集成学习的思想,进一步提高了检测器的性能。
-
公开(公告)号:CN109101948B
公开(公告)日:2021-06-04
申请号:CN201810988895.2
申请日:2018-08-28
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于时空及通道的多注意力机制视频描述方法,通过CNN网络对视频进行视频特征提取,再基于多注意力网络对视频特征和编码上一时刻的输出进行计算,从而得到视频特征在时域、空域及通道上的注意力权重,再将得三组权重再次与视频特征进行计算得到融合的特征,这样我们就能得到更加有效的视频特征,最后将融合的特征行编码输出,得到与视频内容更加一致的描述。
-
公开(公告)号:CN109242090B
公开(公告)日:2020-06-26
申请号:CN201810987113.3
申请日:2018-08-28
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于GAN网络的视频描述及描述一致性判别方法,先分别训练GAN网络中的G网络和D网络,然后在此基础之上,交替训练G网络和D网络,从而得到训练好的GAN网络,最后再将待检测视频输入至训练好的GAN网络,通过G网络输出待检测视频的语义描述;通过D网络输出待检测视频语义描述的评价得分,进而判断描述的一致性。
-
公开(公告)号:CN110348437A
公开(公告)日:2019-10-18
申请号:CN201910567434.2
申请日:2019-06-27
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于弱监督学习与遮挡感知的目标检测方法,先对图片进行多层特征融合,得到包含更多信息和细节的特征图,并结合特征图提取上下文信息块;再通过弱监督方法来定位判别性区域,并利用含有丰富信息的特征图遮挡目标的判别性区域来生成难例样本,最后基于难例样本和上下文信息块进行模型训练和目标检测。
-
公开(公告)号:CN109242090A
公开(公告)日:2019-01-18
申请号:CN201810987113.3
申请日:2018-08-28
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于GAN网络的视频描述及描述一致性判别方法,先分别训练GAN网络中的G网络和D网络,然后在此基础之上,交替训练G网络和D网络,从而得到训练好的GAN网络,最后再将待检测视频输入至训练好的GAN网络,通过G网络输出待检测视频的语义描述;通过D网络输出待检测视频语义描述的评价得分,进而判断描述的一致性。
-
公开(公告)号:CN109101948A
公开(公告)日:2018-12-28
申请号:CN201810988895.2
申请日:2018-08-28
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于时空及通道的多注意力机制视频描述方法,通过CNN网络对视频进行视频特征提取,再基于多注意力网络对视频特征和编码上一时刻的输出进行计算,从而得到视频特征在时域、空域及通道上的注意力权重,再将得三组权重再次与视频特征进行计算得到融合的特征,这样我们就能得到更加有效的视频特征,最后将融合的特征行编码输出,得到与视频内容更加一致的描述。
-
-
-
-
-
-
-