一种基于关键框点检测的图像样本生成方法

    公开(公告)号:CN117218489A

    公开(公告)日:2023-12-12

    申请号:CN202311174074.2

    申请日:2023-09-12

    Abstract: 本发明公开的一种基于关键框点检测的图像样本生成方法,属于计算机视觉领域。本发明为以高斯随机噪声作为输入,通过关键框点生成网络,预设矩形的目标生成位置和嵌入,使用马氏‑高斯heatmap作为初始掩膜,结合Swin‑Transformer‑SPADE生成器生成控制目标生成位置和大小的掩膜,生成分别生成样本图像的前景和背景并最终生成样本图像。可控生成指能够直接解耦图像中物体坐标信息,将图像分解为物体的位置和外观,通过重新定位和交换关键点重新排列生成图像,带标签生成指能够直接保存关键框位置作为目标位置信息。对少样本数据库中的带标签图像样本进行补充,缓解目标检测网络由于缺乏样本而造成的目标检测模型过拟合问题,提升目标检测准确率。

    基于自注意力的时间通道联合注意力的事件流分类方法

    公开(公告)号:CN116385797A

    公开(公告)日:2023-07-04

    申请号:CN202310422806.9

    申请日:2023-04-20

    Abstract: 本发明公开的基于自注意力的时间通道联合注意力的事件流分类方法,属于计算机视觉识别技术领域。本发明实现方法为:对神经形态数据集预处理,将事件流表示的数据转换为基于帧的表示形式;基于自注意力的时间通道联合注意力模块采用压缩和激励结构;在压缩阶段分别采用平均池化和最大池化聚合空间信息并将其叠加合并,得到时间‑通道特征;在激励阶段采用自注意力对该时间‑通道特征进行全局建模,获取通道信息在时间维度的全局依赖性;通过训练自注意力的时间通道联合注意力的脉冲神经网络,捕获时间和通道维度的全局上下文信息;通过训练好的脉冲神经网络实现事件流分类,提高对事件流分类精度。本发明能够提高视觉识别精度和效率。

Patent Agency Ranking