一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法

    公开(公告)号:CN112653899B

    公开(公告)日:2022-07-12

    申请号:CN202011509545.7

    申请日:2020-12-18

    Abstract: 本发明涉及一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法。首先对网络直播视频进行关键帧提取,得到视频的关键帧数据。为了利用视频帧的多尺度特征,按照特征金字塔网络的多尺度结构,设计了一个并行通路。该并行通路是自下而上构建的,与原有主干通路之间利用横向连接和斜向连接进行信息交换,其中横向连接和斜向连接均为卷积运算。考虑到网络直播的画面表现形式多以人为主体,同时夹杂大量冗余信息,因此引入空间——通道联合注意力,便于聚焦画面主体特征。最后,将融合了联合注意力的并行特征金字塔结合卷积层和池化层,构造ResNeSt特征提取模块,通过多层模块叠加,实现复杂场景下网络直播视频的特征提取。

    选择性注意线索指导的不良主播检测方法、装置及电子设备

    公开(公告)号:CN109492124B

    公开(公告)日:2022-03-25

    申请号:CN201811397237.2

    申请日:2018-11-22

    Abstract: 本申请实施例提供一种选择性注意线索指导的不良主播检测方法、装置及电子设备,该方法包括:获取待测直播音视频;基于所述待测直播音视频生成第二耦合特征;计算所述第二耦合特征与预存的各类型的影音数据对应的第一耦合特征之间的汉明距离,其中,所述第二耦合特征采用与所述第一耦合特征相同的方式生成;将与所述第二耦合特征的汉明距离小于预设阈值的第一耦合特征所对应的影音数据的类型判定为所述待测直播音视频的类型,并输出。由此,可靠地检测出直播音视频的类型。

    一种中医舌色噪声标注样本的自动识别与清洗方法

    公开(公告)号:CN114037011A

    公开(公告)日:2022-02-11

    申请号:CN202111316442.3

    申请日:2021-11-08

    Abstract: 本发明公开了一种中医舌色噪声标注样本的自动识别与清洗方法,通过对比预测标签与人工标注标签的概率关系,采用两种不同的筛选策略,实现对舌色噪声标注数据的准确、自动识别与清洗。本发明将人工标注标签称为硬标签,将通过模型得到的标签预测概率称为软标签,将预测概率最大值对应的标签称为伪标签。本发明利用深度网络模型进行样本标签的预测,进而进行噪声样本的自动识别和筛选,结果更加客观、准确。另外,整个过程没有专家的参与,不需要耗费人力,同时降低了人为带来噪声的可能性,提高了噪声标注样本识别的准确率;在模型训练前进行数据集的处理,使得处理后的数据集可以适用于其他分类模型。

    一种多层级深度特征融合的中医舌质颜色分类方法

    公开(公告)号:CN110378882B

    公开(公告)日:2021-09-10

    申请号:CN201910616863.4

    申请日:2019-07-09

    Abstract: 一种多层级深度特征融合的中医舌质颜色分类方法属于计算机视觉领域和中医舌诊诊领域,具体涉及深度学习、图像处理等技术。本发明以人体舌图像为研究对象,在全面分析人体舌质颜色特征的基础上,将深度学习的理论知识应用于舌质颜色特征分类中,提出一种基于多层级深度特征融合的中医舌质颜色分类方法。该方法通过进行多层特征融合以增加特征的多样性,以融合后的特征进行分类模型训练,以提高中医舌质颜色分类的准确性和鲁棒性。

    一种基于生成对抗网络的复合降质图像高质量重建方法

    公开(公告)号:CN109685072B

    公开(公告)日:2021-05-14

    申请号:CN201811575838.8

    申请日:2018-12-22

    Abstract: 本发明公开了一种基于生成对抗网络的复合降质图像高质量重建方法,针对同时含有雾霾,系统噪声,低照度和压缩失真等多种降质问题的低质量图像,本发明首先从针对复合因素降质图像重建的角度出发,建立了一种基于生成对抗网络的复合降质图像高质量重建方法,可完成针对受雾霾,低照度,压缩,系统噪声,光学模糊等因素组合降质图像的重建;其次,本发明采用非对称的生成网络,大大减少了模型的参数量,使模型易于训练和使用;再者,采用端到端的思想,简化了重建系统的架构,省去了预处理与后处理;最后,生成网络全部由卷积层组成,可输入任意尺寸复合降质图像进行重建。

    一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法

    公开(公告)号:CN112653899A

    公开(公告)日:2021-04-13

    申请号:CN202011509545.7

    申请日:2020-12-18

    Abstract: 本发明涉及一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法。首先对网络直播视频进行关键帧提取,得到视频的关键帧数据。为了利用视频帧的多尺度特征,按照特征金字塔网络的多尺度结构,设计了一个并行通路。该并行通路是自下而上构建的,与原有主干通路之间利用横向连接和斜向连接进行信息交换,其中横向连接和斜向连接均为卷积运算。考虑到网络直播的画面表现形式多以人为主体,同时夹杂大量冗余信息,因此引入空间——通道联合注意力,便于聚焦画面主体特征。最后,将融合了联合注意力的并行特征金字塔结合卷积层和池化层,构造ResNeSt特征提取模块,通过多层模块叠加,实现复杂场景下网络直播视频的特征提取。

    一种应用浅层神经网络的中医面色自动分类方法

    公开(公告)号:CN107516312B

    公开(公告)日:2019-11-15

    申请号:CN201710692254.8

    申请日:2017-08-14

    Abstract: 一种应用浅层神经网络进行中医面色自动分类的方法属于计算机视觉领域。设计的浅层网络层数共有5层,采用三种不同的层结构,分别为输入层、特征提取层、输出层。输入层由一个卷积层和修正线性单元组成;特征提取层由3层网络组成,前两层的每层都由一个卷积层和ReLU激活函数组成,在卷积层和ReLU之间都有一个批归一化,并在特征提取层的第二个ReLU后面加入池化层,特征提取层的第三层是一个全连接层,后接一个修正线性单元ReLU;输出层由全连接层组成,后加一个softmax分类器。本发明在分类精度上有明显优势,对缩放、平移、旋转等畸变具有不变性,有很强的鲁棒性,能够有效的提高分类精度,将深度学习的理论应用于中医面诊客观化研究。

    一种基于颜色差分的彩色图像边缘检测方法

    公开(公告)号:CN105957067B

    公开(公告)日:2018-10-19

    申请号:CN201610258532.4

    申请日:2016-04-23

    Abstract: 本发明公开了一种基于颜色差分的彩色图像边缘检测方法,属于数字图像处理领域,该方法对平滑滤波操作具有更强的鲁棒性,可以排除大量的噪声边缘,只保留反映物体基本结构的真实边缘。平滑滤波去噪。构成邻域点对。对于平滑滤波后的图像IC(x,y),将每个像素(x,y)相邻的八个像素分别按照水平、竖直、45°和135°总共四个方向分成四个邻域点对。计算颜色相离结果。计算颜色差分图,得到的颜色差分图CDM(x,y)即为最终的边缘检测结果。能够有效抑制噪声干扰,排除大量人们不感兴趣的噪声边缘,仅保留反映物体基本结构变化的真实边缘;得到的边缘对于平滑滤波具有较好的鲁棒性,在滤波窗口尺寸较大时仍然能够具有较强的边缘响应,不易造成重要边缘丢失和断裂。

    一种用于个性化社会图像推荐的视觉注意-标签-用户兴趣树的构建方法

    公开(公告)号:CN105045907B

    公开(公告)日:2018-03-09

    申请号:CN201510487893.1

    申请日:2015-08-10

    Abstract: 一种用于个性化社会图像推荐的视觉注意‑标签‑用户兴趣树的构建方法属于社会图像领域。本发明以标签为纽带将视觉注意与用户兴趣结合起来,利用视觉注意机制分析图像的视觉显著性,构建具有树结构的视觉注意模型,据此获得显著区,分析图像显著信息与标签语义的对应关系,生成显著标签和节点标签,构建标签树模型,进而结合用户历史信息将标签树向用户兴趣树传播,最后由用户兴趣树向用户推荐图像,根据用户对推荐结果的反馈,重新调整树模型,进一步优化个性化社会图像推荐。其中,生成视觉注意树模型细分为四个部分:图像区域分割,显著性度量,树结构的区域合并,生成显著图。本发明提高个性化图像推荐的准确率。

Patent Agency Ranking