-
公开(公告)号:CN114926900A
公开(公告)日:2022-08-19
申请号:CN202210532569.7
申请日:2022-05-10
Applicant: 电子科技大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明属于视频处理技术领域,具体涉及一种前背景分离的人体动作在线检测方法,本发明包括:采集包含人体动作的视频数据并做时序标注;对原始视频数据进行预处理生成数据集;构建基于I3D的骨干网络进行特征提取;构建特征映射模块,设计基于特征模长的对比损失函数,对前背景特征进行初次分离;构建可学习的前景记忆特征与互注意力模块,计算特征序列元素与前景的相似性以分离前背景;构建基于自注意力机制的时序推理器,结合前背景分离结果对特征序列编码;构建分类器基于编码结果完成对人体动作的在线检测。本发明在极少增加模型运算量的前提下,极大提高了待检测人体动作视频帧与历史视频帧之间的辨别性,进而提高人体动作在线检测的检测精度。
-
公开(公告)号:CN115116072B
公开(公告)日:2025-02-11
申请号:CN202210819627.4
申请日:2022-07-12
Applicant: 电子科技大学
Abstract: 本发明属于文本识别技术领域,具体涉及一种基于基线定位与序列建模的自然场景下的藏文识别方法,本发明包括:1)构建自然场景下的藏文图像数据集并进行标注;2)扩充数据集并对数据集图像进行预处理;3)构建基线检测器,对藏文文本的基线位置进行定位;4)构建特征提取器,使用不同的特征提取方法获取横竖排文本图像的序列特征表示;5)构建基于TCN的序列建模网络,建模序列关系;6)构建CTC转录模块,将表征序列关系的输出特征送入转录层得到藏文识别的结果。本发明通过上述技术方案,极大的增强了特征提取、序列关系建模的有效性,提高了序列的并行处理能力,进而提高了自然场景下藏文识别的精度和效率。
-
公开(公告)号:CN114926900B
公开(公告)日:2023-06-16
申请号:CN202210532569.7
申请日:2022-05-10
Applicant: 电子科技大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N5/04
Abstract: 本发明属于视频处理技术领域,具体涉及一种前背景分离的人体动作在线检测方法,本发明包括:采集包含人体动作的视频数据并做时序标注;对原始视频数据进行预处理生成数据集;构建基于I3D的骨干网络进行特征提取;构建特征映射模块,设计基于特征模长的对比损失函数,对前背景特征进行初次分离;构建可学习的前景记忆特征与互注意力模块,计算特征序列元素与前景的相似性以分离前背景;构建基于自注意力机制的时序推理器,结合前背景分离结果对特征序列编码;构建分类器基于编码结果完成对人体动作的在线检测。本发明在极少增加模型运算量的前提下,极大提高了待检测人体动作视频帧与历史视频帧之间的辨别性,进而提高人体动作在线检测的检测精度。
-
公开(公告)号:CN115116072A
公开(公告)日:2022-09-27
申请号:CN202210819627.4
申请日:2022-07-12
Applicant: 电子科技大学
Abstract: 本发明属于文本识别技术领域,具体涉及一种基于基线定位与序列建模的自然场景下的藏文识别方法,本发明包括:1)构建自然场景下的藏文图像数据集并进行标注;2)扩充数据集并对数据集图像进行预处理;3)构建基线检测器,对藏文文本的基线位置进行定位;4)构建特征提取器,使用不同的特征提取方法获取横竖排文本图像的序列特征表示;5)构建基于TCN的序列建模网络,建模序列关系;6)构建CTC转录模块,将表征序列关系的输出特征送入转录层得到藏文识别的结果。本发明通过上述技术方案,极大的增强了特征提取、序列关系建模的有效性,提高了序列的并行处理能力,进而提高了自然场景下藏文识别的精度和效率。
-
-
-