基于多连接编码小波池化的实时图像语义分割方法及系统

    公开(公告)号:CN117152445B

    公开(公告)日:2024-01-12

    申请号:CN202311427065.X

    申请日:2023-10-31

    Applicant: 暨南大学

    Abstract: 本发明公开了基于多连接编码小波池化的实时图像语义分割方法,包括:对原始输入特征图进行初步特征提取,得到初始特征信息;将初始特征信息与第一输入图像进行拼接,得到浅层特征图;对浅层特征图进行小波池化操作后再进行逐步特征融合提取,得到第一混合特征信息;将第一混合特征与第二输入图像进行拼接,得到中层特征图;对中层特征图进行小波池化操作后再进行逐步特征融合提取,得到第二混合特征信息;将第二混合特征信息与第三输入图像进行拼接,得到深层特征图;对浅层特征图、中层特征图以及深层特征图进行融合解码,得到图像语义分割结果。本发明还公开了一种相应的实时图像语义分割系统,实现了实时且高精度的图像语义分

    一种用于神经网络训练的伪标签生成方法及系统

    公开(公告)号:CN117079103B

    公开(公告)日:2024-01-02

    申请号:CN202311331979.6

    申请日:2023-10-16

    Applicant: 暨南大学

    Abstract: 本发明涉及深度学习技术领域,提出一种用于神经网络训练的伪标签生成方法及系统,包括以下步骤:将输入图像及其对应的图像级别标签传输至基于残差结构的分类骨干网络进行注意力池化,得到类激活图,以及,将输入图像传输至显著对象检测网络进行区域检测,得到显著性图;融合类激活图与显著性图的各区域特征,合成输入图像的边界伪标签;利用边界伪标签监督边界检测网络的训练,并将输入图像传输至已训练完成的边界检测网络进行边界检测,提取输入图像的边界;利用边界引导类激活图进行细化传播,生成与输入图像相对应的语义分割伪标签。本发明能够大幅降低人工标注像素级标签的成本和时间,提高语义分割伪标签的精度和生成效

    基于多连接编码小波池化的实时图像语义分割方法及系统

    公开(公告)号:CN117152445A

    公开(公告)日:2023-12-01

    申请号:CN202311427065.X

    申请日:2023-10-31

    Applicant: 暨南大学

    Abstract: 本发明公开了基于多连接编码小波池化的实时图像语义分割方法,包括:对原始输入特征图进行初步特征提取,得到初始特征信息;将初始特征信息与第一输入图像进行拼接,得到浅层特征图;对浅层特征图进行小波池化操作后再进行逐步特征融合提取,得到第一混合特征信息;将第一混合特征与第二输入图像进行拼接,得到中层特征图;对中层特征图进行小波池化操作后再进行逐步特征融合提取,得到第二混合特征信息;将第二混合特征信息与第三输入图像进行拼接,得到深层特征图;对浅层特征图、中层特征图以及深层特征图进行融合解码,得到图像语义分割结果。本发明还公开了一种相应的实时图像语义分割系统,实现了实时且高精度的图像语义分割。

    一种基于轻量级神经网络模型的图像语义分割方法及系统

    公开(公告)号:CN116993987A

    公开(公告)日:2023-11-03

    申请号:CN202311095088.5

    申请日:2023-08-28

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于轻量级神经网络模型的图像语义分割方法及系统,涉及人工智能领域。所述方法包括:所述轻量级神经网络模型包括初始化模块、空间分支、语义分支和多尺度特征融合解码器;所述图像语义分割方法包括:响应于待处理图像的处理指令,基于初始化模块对待处理图像进行特征提取,得到第一特征图;基于空间分支提取第一特征图的空间信息;基于语义分支提取第一特征图的多尺度特征信息,并融合多尺度特征信息和空间信息,得到增强特征图;基于多尺度特征融合解码器,将第一特征图与增强特征图进行融合,并进行图像尺寸恢复,得到图像语义分割结果。相较于现有技术,本发明在分割精度与实时性之间实现更好的性能均衡。

    基于空洞残差稠密卷积的图像超分辨率重建方法及系统

    公开(公告)号:CN114742701A

    公开(公告)日:2022-07-12

    申请号:CN202210209804.7

    申请日:2022-03-03

    Applicant: 暨南大学

    Abstract: 本发明提出一种基于空洞残差稠密卷积的图像超分辨率重建方法及系统,包括构建包括特征提取层、非线性映射层和图像重建层的图像重建网络;非线性映射层包括由若干个依次稠密连接的空洞卷积层和标准卷积层组成的空洞残差稠密模块;将预处理后的待重建图像输入图像重建网络,待重建图像经过特征提取以及与高分辨率图像的映射,图像重建网络输出高分辨率图像。使用稠密连接的空洞卷积层和标准卷积层组成的残差结构,相比标准卷积层能够提取更多的图像的语境信息并且能够提高特征信息的重复利用率,增加前面卷积层提取的特征信息对最后图像重建的贡献率,充分利用图像的特征信息,降低网络的训练难度,实现图像重建的质量和效率的提高。

    轻量级多尺度特征融合的实时图像语义分割方法及系统

    公开(公告)号:CN114445430A

    公开(公告)日:2022-05-06

    申请号:CN202210365378.6

    申请日:2022-04-08

    Applicant: 暨南大学

    Abstract: 本发明提出一种轻量级多尺度特征融合的实时图像语义分割方法,包括:构建包括初始化模块、分离‑提取‑合并瓶颈模块、分区‑融合通道注意力模块、特征融合模块和多尺度注意力解码器的图像语义分割网络。通过图像语义分割网络提取待处理图像初始特征图的多尺度特征,得到多尺度特征图;提取并融合初始特征图的全局通道信息和局部通道信息,得到通道信息特征图;将多尺度特征图、通道信息特征图和原始的待处理图像进行特征融合,得到融合特征图;基于融合特征图进行图像精度恢复,得到图像语义分割结果。本发明能够在参数量相对较小的轻量级图像语义分割网络模型中保证模型的精度和准确率,提高模型的推理速度,实现图像的实时语义分割。

    一种适用于图像识别的卷积神经网络模型压缩方法

    公开(公告)号:CN112734010A

    公开(公告)日:2021-04-30

    申请号:CN202110010138.X

    申请日:2021-01-04

    Applicant: 暨南大学

    Abstract: 本发明公开了一种适用于图像识别的卷积神经网络模型压缩方法,属于卷积神经网络模型压缩技术领域。本发明首先确定所选需要压缩的卷积神经网络应包含一个以上的卷积层,并且在每个卷积层中都存在多个卷积核过滤器,每个卷积核过滤器都存在多个通道,每个通道都是一个卷积核,每个卷积核都与一个输入特征图相对应;其次依次计算各个卷积层卷积核参数量的大小,确定最大值裁剪的顺序;最终按照最大值裁剪顺序,依据权重和标准对各层卷积核进行裁剪,完成所有卷积层的裁剪操作。本发明通过在权重和评价卷积核重要性的基础上,引入了最大值裁剪策略,能够弥补卷积层层间冗余差异性所带来的裁剪不彻底的问题,有效地压缩卷积神经网模型。

    一种基于FPGA的Gige Vision接口图像传输系统与方法

    公开(公告)号:CN109089029B

    公开(公告)日:2020-11-13

    申请号:CN201811029173.0

    申请日:2018-09-05

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于FPGA的Gige Vision接口图像传输系统与方法,包括图像传感器、上位机、局域千兆以太网络、基于Gige接口的嵌入式图像采集设备,其中基于Gige接口的嵌入式图像采集设备为系统的核心设备,包括FPGA芯片、PHY芯片;其中FPGA信号输入端与图像传感器输出信号端连接;FPGA与PHY芯片互相信号连接;PHY芯片与RJ45接口互相连接,RJ45接口通过网线与PC上位机相连接。本发明实现的基于FPGA与Gige接口的图像采集嵌入式系统,传输效率高、传输距离远,且对比起工业界中同类的IP核,具有占用逻辑资源较少、硬件需求较低等优点。

    一种适用于HEVC标准的帧间编码方法与系统

    公开(公告)号:CN110446040A

    公开(公告)日:2019-11-12

    申请号:CN201910692795.X

    申请日:2019-07-30

    Applicant: 暨南大学

    Abstract: 本发明公开了一种适用于HEVC标准的帧间编码方法及系统,该方法包括下述步骤:确定当前帧CTU与参考帧同位CTU的位置,计算当前帧CTU与参考帧同位CTU的平均像素差值D;若平均像素差值D满足:D<T1,则通过参考帧同位CTU能分割的最大深度col_maxdepth预测当前帧CTU能遍历的最大深度cu_maxdepth,若不满足,则执行下一步骤;若D满足:T1≤D<T2,采用时空域加权预测计算当前帧CTU的加权预测值predict_depth,若不满足,则继续正常编码;根据当前帧CTU的加权预测值predict_depth预判当前帧CTU的深度范围,确定当前帧CTU能遍历的最大深度cu_maxdepth。本发明有效降低HEVC帧间编码的计算复杂度,更加充分地利用编码单元的时空域深度相关性,节省更多的编码时间,能够更好地应用到实时编解码领域中。

    一种自适应波特率的信号接收方法

    公开(公告)号:CN104714920B

    公开(公告)日:2017-08-08

    申请号:CN201510080088.7

    申请日:2015-02-13

    Applicant: 暨南大学

    Abstract: 本发明公开了一种自适应波特率的信号接收方法,步骤:S1、建立接收方接收的每段高/低电平信号获得脉冲个数与发送方的发送波特率关系表;S2、发送方发送数据;S3、接收方接收信号,获取每段持续时间内高/低电平的脉冲个数;同时对接收到的数据帧长度进行计数;S4、对脉冲个数进行近似处理,查表得到对应发送方的发送波特率可能值的最小值,对所有的最小值进行比较并保留最大值为暂时发送波特率;S5、根据发送波特率和发送方的数据帧格式,确定接收方接收数据帧的总长度;S6、判断接收到数据帧的长度是否达到总长度,若是,接收完成,将S4中的最大值作为发送波特率,对之前获取的各个脉冲个数进行计算,得到发送方的数据帧;否则返回S3。

Patent Agency Ranking