视频动作识别模型的训练方法、装置、计算设备及存储介质

    公开(公告)号:CN114266997B

    公开(公告)日:2025-05-13

    申请号:CN202111591869.4

    申请日:2021-12-23

    Abstract: 本发明公开一种视频动作识别模型的训练方法、装置、计算设备及存储介质,该方法包括:按预设的采样策略对样本视频进行采样,得到至少两个图片序列,每个所述图片序列包括从所述样本视频采集的按时序排列的多帧图片;通过R(2+1)D网络对所述图片序列进行特征提取,得到所述样本视频的视频序列特征;将所述视频序列特征输入多标签分类模块进行处理得到视频动作分类结果,并基于所述视频动作分类结果计算损失函数;根据所述损失函数的计算结果调整所述R(2+1)D网络和多标签分类模块,得到目标视频动作识别模型。根据本发明实施例可以有效解决动作识别任务同一输入视频多个类别同时出现导致难以归类的问题,而且对较长的视频输入也可以有效识别。

    行人重识别模型的训练方法、装置、计算设备及存储介质

    公开(公告)号:CN113936302B

    公开(公告)日:2023-04-07

    申请号:CN202111295755.5

    申请日:2021-11-03

    Abstract: 本发明公开一种行人重识别模型的训练方法、装置、计算设备及存储介质,该方法包括:获取第一行人重识别训练数据集所述第一行人重识别训练数据集输入预设的行人重识别模型进行处理,并基于处理结果得到第一损失函数所述第一行人重识别训练数据集进行处理得到第二行人重识别训练数据集所述第二行人重识别训练数据集输入远程监督网络进行处理,并根据处理结果得到第二损失函数;所述第一损失函数和第二损失函数所述预设的行人重识别模型,得到目标行人重识别模型。根据本发明实施例通过增加监督网络提供监督信息来实现不增加识别网络复杂度的前提下,扩充训练样本数量的同时也有效提升了行人重识别网络的识别性能。

    一种应对标签标注不完整的多标签分类的方法及装置

    公开(公告)号:CN115908921A

    公开(公告)日:2023-04-04

    申请号:CN202211457173.7

    申请日:2022-11-21

    Abstract: 本申请提出了一种应对标签标注不完整的多标签分类的方法及装置,该方法包括以下步骤:S1、获取验证集和训练集,并且将验证集中的每张图片均人工标记上多个类别标签;以及S2、基于训练集和总损失函数训练多标签分类模型,其中,总损失函数包括正标签损失函数、负标签损失函数以及未标记标签损失函数;以及S3、基于验证集和再平衡参数计算获得未标记标签损失函数;以及S4、最终获得训练完成的多标签分类模型。本申请通过利用少部分标注完整的验证集来指导纠正大型多标签训练集中的标签标注不完整部分损失函数的计算,有效地节约了人工标记成本并提升了多标签分类任务的准确率。

    一种基于置信学习的行人重识别方法、装置及存储介质

    公开(公告)号:CN111783568A

    公开(公告)日:2020-10-16

    申请号:CN202010549958.1

    申请日:2020-06-16

    Abstract: 本发明提出了一种基于置信学习的行人重识别方法、装置及存储介质,该方法包括:从视频图像资源库的获取N张行人图像,从中随机选取M张行人图像作为查询图像,其余作为查询底库;使用行人重识别模型从中筛选一定数目的行人图像保存在一候选训练集,并该数目的行人图像标记一个新的人员id;将候选训练集与原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差后进行校验,然后对行人重识别模型进行重新训练得到重训练后的行人重识别模型后进行线上更新以进行行人重识别。本发明利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据,从而提供更多的可用训练数据,有效地提高了行人重识别系统的泛化性能及准确率。

    基于卷积神经网络的长文本分类识别方法、装置及介质

    公开(公告)号:CN110543560B

    公开(公告)日:2022-10-11

    申请号:CN201910731678.X

    申请日:2019-08-08

    Abstract: 本发明提供了一种基于多粒度卷积神经网络的长文本分类识别方法、装置及存储介质,该方法包括:将所述训练样本集中的长文本样本基于所述映射表转换为数字序列得到数字序列形式的训练样本集,使用所述数字序列形式的训练样本集训练多粒度卷积神经网络得到训练后的多粒度卷积神经网络,基于所述映射表将待分类识别的长文本转换为数字序列使用训练后的多粒度卷积神经网络进行分类识别得到分类识别结果。本发明将汉字文本转换为数字序列进行处理,提高了处理速度,且本发明的多粒度卷积神经网络结构,具有提取全局特征和局部特征的分支,由于采用多分支的结构,保留了长文本的整体语义信息及局部关键信息,有效提升长文本分类识别的准确率。

    基于半监督训练方式的行人重识别方法、装置及介质

    公开(公告)号:CN110555390B

    公开(公告)日:2022-09-09

    申请号:CN201910735333.1

    申请日:2019-08-09

    Abstract: 本发明提供了一种基于半监督训练方式的行人重识别方法、装置及存储介质,该方法包括:基于半监督训练方式使用采集的目标域样本集和开源数据集构建训练样本集,使用所述训练样本集对深度残差网络进行训练得到训练后的深度残差网络模型,对采集的行人图像使用训练后的深度残差网络模型进行识别,得到行人图像的特征值,再根据特征值之间的余弦距离来确定是否为同一个人。本发明生成了虚拟样本,且在生成虚拟样本时构建了平滑函数,使得构建的虚拟样本更加逼真,同时使用DBSCAN聚类算法为虚拟样本添加伪标签,深度神经网络中使用了局部特征和全局特征,采用不同权重组合的联合损失函数,使得训练后的深度神经网络识别准确更加可靠。

    一种神经网络训练方法
    19.
    发明授权

    公开(公告)号:CN112381161B

    公开(公告)日:2022-08-30

    申请号:CN202011296897.9

    申请日:2020-11-18

    Abstract: 本发明涉及一种神经网络训练方法,包括以下步骤:S1、初步训练,对类别数据不均衡的训练样本数据进行深度学习神经网络训练,得到一个初步最佳训练模型;S2、根据该初步最佳训练模型对训练样本数据进行处理;S3、二次训练,用经过S2处理后的数据在该初步最佳训练模型基础上继续迭代训练至神经网络训练模型收敛。该方法利用DBSCAN聚类结果及已有标签,指导神经网络训练过程中每个batch的数据采样,通过类别间数据的均衡性,单类别内部数据特征多样性,提高了算法模型的收敛速度,提高了算法模型泛化性能。

    一种基于置信学习的行人重识别方法、装置及存储介质

    公开(公告)号:CN111783568B

    公开(公告)日:2022-07-15

    申请号:CN202010549958.1

    申请日:2020-06-16

    Abstract: 本发明提出了一种基于置信学习的行人重识别方法、装置及存储介质,该方法包括:从视频图像资源库的获取N张行人图像,从中随机选取M张行人图像作为查询图像,其余作为查询底库;使用行人重识别模型从中筛选一定数目的行人图像保存在一候选训练集,并该数目的行人图像标记一个新的人员id;将候选训练集与原始训练集合并得到合并训练集,并使用置信训练寻找合并训练集的标签误差后进行校验,然后对行人重识别模型进行重新训练得到重训练后的行人重识别模型后进行线上更新以进行行人重识别。本发明利用置信学习及现有行人重识别系统清洗监控系统下的海量视频数据,从而提供更多的可用训练数据,有效地提高了行人重识别系统的泛化性能及准确率。

Patent Agency Ranking