-
公开(公告)号:CN117218489A
公开(公告)日:2023-12-12
申请号:CN202311174074.2
申请日:2023-09-12
Applicant: 北京理工大学
IPC: G06V10/774 , G06T11/00 , G06N3/0475 , G06N3/094 , G06N3/0499 , G06N3/048 , G06N3/0464 , G06N3/045 , G06N3/084
Abstract: 本发明公开的一种基于关键框点检测的图像样本生成方法,属于计算机视觉领域。本发明为以高斯随机噪声作为输入,通过关键框点生成网络,预设矩形的目标生成位置和嵌入,使用马氏‑高斯heatmap作为初始掩膜,结合Swin‑Transformer‑SPADE生成器生成控制目标生成位置和大小的掩膜,生成分别生成样本图像的前景和背景并最终生成样本图像。可控生成指能够直接解耦图像中物体坐标信息,将图像分解为物体的位置和外观,通过重新定位和交换关键点重新排列生成图像,带标签生成指能够直接保存关键框位置作为目标位置信息。对少样本数据库中的带标签图像样本进行补充,缓解目标检测网络由于缺乏样本而造成的目标检测模型过拟合问题,提升目标检测准确率。
-
公开(公告)号:CN116385797A
公开(公告)日:2023-07-04
申请号:CN202310422806.9
申请日:2023-04-20
Applicant: 北京理工大学
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/049 , G06N3/084
Abstract: 本发明公开的基于自注意力的时间通道联合注意力的事件流分类方法,属于计算机视觉识别技术领域。本发明实现方法为:对神经形态数据集预处理,将事件流表示的数据转换为基于帧的表示形式;基于自注意力的时间通道联合注意力模块采用压缩和激励结构;在压缩阶段分别采用平均池化和最大池化聚合空间信息并将其叠加合并,得到时间‑通道特征;在激励阶段采用自注意力对该时间‑通道特征进行全局建模,获取通道信息在时间维度的全局依赖性;通过训练自注意力的时间通道联合注意力的脉冲神经网络,捕获时间和通道维度的全局上下文信息;通过训练好的脉冲神经网络实现事件流分类,提高对事件流分类精度。本发明能够提高视觉识别精度和效率。
-
公开(公告)号:CN114662644A
公开(公告)日:2022-06-24
申请号:CN202111294464.4
申请日:2021-11-03
Applicant: 北京理工大学
Abstract: 本发明公开的基于动态阈值神经元的深度脉冲神经网络的图像识别方法,属于类脑计算、深度学习领域。针对现有DNN‑to‑SNN转换技术实现深度SNN时,脉冲传输速率低、发放率低、转换精度存在损失的问题。本发明实现方法为:首先训练DNN,得到权重并保存;然后,基于DNN‑to‑SNN转换方法,将DNN中的激活函数ReLU转换为SNN中具有动态阈值的IF神经元,将DNN权重进行归一化,映射到SNN;最后,仿真运行SNN,每个时间步计算每个神经元的阈值。本方法适用于图像分类识别、目标识别与跟踪等人工智能领域,可加快脉冲传输速率,提高脉冲发放率,加快信息传输,同时降低转换损失。
-
-