-
公开(公告)号:CN112395442B
公开(公告)日:2022-06-14
申请号:CN202011084050.4
申请日:2020-10-12
Applicant: 杭州电子科技大学
IPC: G06F16/535 , G06F16/54 , G06F16/55 , G06F16/583 , G06F16/9535 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种移动互联网上的低俗图片自动识别与内容过滤方法。本发明步骤:1.基于两大开源数据集建立用于训练和测试四分类低俗图像数据集;2.进行数据预处理;3.构建多阶段注意力机制的神经网络架构;4.基于四分类低俗图像数据集,对多阶段注意力机制的神经网络架构进行训练,获得注意力机制模型;5.将训练过后的注意力机制模型用数据的测试集进行测试,以验证模型的准确率指标;6.将最优的注意力机制模型用于数据的可视化,以热力图的形式展现出图像的高权重重点区域。本发明通过部署注意力机制,对图像的特征图的关键特征所在的区域进行加权操作。通过热力图的形式对特征图进行了数据可视化,通过可视化实验更好地解释模型的决策过程。
-
公开(公告)号:CN115391733A
公开(公告)日:2022-11-25
申请号:CN202211078771.3
申请日:2022-09-05
Applicant: 杭州电子科技大学
Abstract: 本发明涉及基于体素特征和稀疏Sinkhorn Transformer的3D姿态估计方法,将三维的体素特征分解成Transformer可处理的一维体素序列,然后把序列按同样的大小分为多个组;计算出每个体素元素的Key、Value和Query,计算每组的平均Key、平均Value和平均Query,计算组与组之间的相关度;按照相关度计算出转换矩阵;对同一个组内的元素和其对应相关组之间的元素进行自注意力操作;把一维体素序列还原回三维空间,并与CNN提取的特征进度融合,得出最终的体素特征,把每个关节在体素中的概率与体素在三维空间中的坐标进行加权平均得到关节的估计位置。本发明的估计精度高。
-
公开(公告)号:CN112395442A
公开(公告)日:2021-02-23
申请号:CN202011084050.4
申请日:2020-10-12
Applicant: 杭州电子科技大学
IPC: G06F16/535 , G06F16/54 , G06F16/55 , G06F16/583 , G06F16/9535 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种移动互联网上的低俗图片自动识别与内容过滤方法。本发明步骤:1.基于两大开源数据集建立用于训练和测试四分类低俗图像数据集;2.进行数据预处理;3.构建多阶段注意力机制的神经网络架构;4.基于四分类低俗图像数据集,对多阶段注意力机制的神经网络架构进行训练,获得注意力机制模型;5.将训练过后的注意力机制模型用数据的测试集进行测试,以验证模型的准确率指标;6.将最优的注意力机制模型用于数据的可视化,以热力图的形式展现出图像的高权重重点区域。本发明通过部署注意力机制,对图像的特征图的关键特征所在的区域进行加权操作。通过热力图的形式对特征图进行了数据可视化,通过可视化实验更好地解释模型的决策过程。
-
-