-
公开(公告)号:CN116092512A
公开(公告)日:2023-05-09
申请号:CN202211740126.3
申请日:2022-12-30
Applicant: 重庆邮电大学
IPC: G10L21/0272 , G10L17/04 , G10L17/18
Abstract: 本发明涉及一种基于数据生成的小样本语音分离方法,属于语音分离领域,包括以下步骤:S1:采集并构建待分离语音数据集和目标说话人干净语音数据集;S2:对数据集进行预处理;S3:利用基于LSTM的语音匹配模型对预处理后的待分离语音数据集中的每段语音进行帧级别的目标说话人匹配,根据匹配结果,将语音段判断为:不含目标说话人、只包含一个目标说话人、包含多个目标说话人;S4:利用基于GAN的包含多个目标说话人的语音生成模型扩充待分离语音段;S5:构建并训练基于TCN的语音分离模型,将待分离的包含多个目标说话人的语音分离得到单一目标说话人的语音数据,最后拼接出单一说话人的完整语音。
-
公开(公告)号:CN115985340A
公开(公告)日:2023-04-18
申请号:CN202210997349.1
申请日:2022-08-19
Applicant: 重庆邮电大学
IPC: G10L25/48 , G10L25/51 , G10L25/30 , G10L25/24 , G10L25/63 , G10L13/04 , G10L13/047 , G10L13/08 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/084
Abstract: 本发明属于网络安全‑‑合成语音检测领域,具体涉及一种基于生成对抗网络的合成语音检测方法及系统,该方法包括获取待检测的语音数据,对语音数据进行预处理;采用训练好的语音检测模型对预处理后的语音数据进行检测,得到检测结果,对检测结果进行分类标记,所述语音检测模型为生成对抗网络;本发明利用生成对抗网络模型的博弈学习思想最终达到良好的合成语音检测效果,结合了自然语言处理技术对期望文本进行分词处理以及情感分析,其次采用了编码器对注音字符进行特征提取得到隐藏特征,再将其送入多头注意力机制,最后将隐藏特征解码,重构出更贴近目标对象的合成语音向量,提高了检测的准确度。
-
公开(公告)号:CN114677200A
公开(公告)日:2022-06-28
申请号:CN202210368272.1
申请日:2022-04-01
IPC: G06Q30/06 , G06F16/9535 , G06F16/958 , G06F21/60 , G06N20/10
Abstract: 本发明涉及一种基于多方高维数据纵向联邦学习的商业信息推荐方法及装置,属于大数据技术领域,包括以下步骤:S1:创建同态加密的密钥对。进行多方数据的预处理和加密样本对齐;S2:构建纵向联邦LightGBM模型;S3:将纵向联邦LightGBM模型转换成神经网络,作为纵向联邦ECA‑DeepGBM模型的GBDT2NN部分;S4:纵向联邦ECA‑DeepGBM模型CatNN部分前馈过程计算;S5:构建损失函数及模型整体训练,基于训练好的高维数据分类预测模型,实现基于多方高维数据的商业信息推荐。本发明通过多方数据增加特征维度的方式,以达到进行精准商业信息推荐的目的。
-
公开(公告)号:CN112800967B
公开(公告)日:2022-05-17
申请号:CN202110123640.1
申请日:2021-01-29
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种姿态驱动的遮挡行人重识别方法,属于计算机领域。本发明包括:输入待识别图像,经过预处理后调整为标准输入图像;利用行人重识别网络提取输入图像特征,得到全局特征;利用人体姿态估计网络提取输入图像特征,得到人体姿态特征;基于人体姿态特征,分别利用局部可见度预测器模块获取可见度评分,利用局部注意力生成器模块获取注意力掩膜;最后根据可见度评分选取输入图像可见部分的局部特征和图像库中的对应特征计算欧氏距离并按照升序排序,将排序结果作为行人重识别模型的输出。本发明帮助行人重识别网络定位遮挡区域,降低了相同身份的受遮挡行人与完整行人的特征差异,提高了行人重识别模型的泛化能力。
-
公开(公告)号:CN113963315A
公开(公告)日:2022-01-21
申请号:CN202111357367.5
申请日:2021-11-16
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种复杂场景下实时视频多人行为识别方法及系统,属于机器视觉技术领域。该方法包括:采集视频数据;建立场景人脸标签库,用于人脸识别模型训练;构建轻量化SlowFast模型用于复杂场景多人行为识别;建立不同人员类别异常行为动作标签库,建立训练行为动作标签库;将训练数据集经过预处理之后,输入到构建的轻量化SlowFast网络中进行训练;利用人脸识别模型和轻量化SlowFast网络模型进行实际场景行为动作检测、识别。本发明通过人脸识别,确定人员类别身份,建立人脸检测框与人员位置定位框的关联关系,对场景中目标人员的行为动作进行检测和识别,以实现在复杂场景中不同类别人员异常行为的监测和预警。
-
公开(公告)号:CN116311379B
公开(公告)日:2025-04-29
申请号:CN202310351000.5
申请日:2023-04-04
Applicant: 重庆邮电大学
IPC: G06V40/10 , G06V10/80 , G06V10/774 , G06V10/764 , G06F17/16 , G06N3/04 , G06N3/08
Abstract: 本发明属于计算机视觉领域,涉及一种基于Transformer网络模型的行人重识别方法、装置及计算机设备;所述方法包括获取目标行人图像并预处理,生成标准行人图像;将标准行人图像采用滑动窗口划分为多个具有重叠部分的方形子图像;对各方形子图像经过水平线性投影和垂直线性投影,得到水平特征矩阵和垂直特征矩阵;将其输入到预先训练好的改进Transformer网络模型中,预测得到目标行人图像的识别结果。本发明利用滑动窗口将输入图像划分为多个有重叠部分的正方形小块,突出了遮挡物与行人交界边缘处行人的特征;利用改进的Transformer网络结构,加强了行人特征在各个方向上的关联,提高了行人重识别准确度。
-
公开(公告)号:CN118942121A
公开(公告)日:2024-11-12
申请号:CN202411121492.X
申请日:2024-08-15
Applicant: 重庆邮电大学
IPC: G06V40/10 , G06V20/52 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及一种针对小目标的安全帽佩戴检测系统及方法,属于计算机视觉技术领域,包括采集建筑工地现场图像并进行数据标注,构建训练数据集和测试数据集并进行预处理;基于预设YOLOX模型构建针对小目标的安全帽佩戴检测网络,所述安全帽佩戴检测网络用于安全帽佩戴检测;将训练集图像和测试集图像输入到所述安全帽佩戴检测网络中进行训练,并采用WIoU v3作为边界框回归损失函数调整所述安全帽佩戴检测网络的参数;将待测建筑工地现场图像输入到训练好的安全帽佩戴检测网络,输出得到所述待测建筑工地现场图像的实时检测结果。本发明可以提高安全帽佩戴检测的精度,以实现对场景中安全帽佩戴情况的识别和检测。
-
公开(公告)号:CN118298108A
公开(公告)日:2024-07-05
申请号:CN202410455007.6
申请日:2024-04-16
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种面部表情驱动的三维动态人脸重建方法,属于计算机视觉技术领域,包含以下步骤:S1:预先采集正面人脸的视频数据并进行预处理,再对人脸表情参数进行方差分析,获取高频变化维度和低频变化维度,提取用于面部表情驱动的人脸动态信息;S2:确定三维空间点的编码特征,包括多分辨率哈希编码特征和球谐编码;所述多分辨率哈希编码用于编码空间的位置特征;所述球谐编码用于编码空间的观察方向,提取观察方向中高频变化的信息;S3:融合人脸表情参数与三维空间点的编码特征,驱动基于隐式神经表示的三维动态人脸;S4:引入光度、几何和感知三个层面的损失,分阶段优化人脸表示,在光度层面加强对于眼部和嘴部的监督。
-
公开(公告)号:CN114782078B
公开(公告)日:2024-06-18
申请号:CN202210347941.7
申请日:2022-04-01
Applicant: 重庆邮电大学
IPC: G06Q30/0201 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及一种针对高维数据的商业信息评估方法及系统,属于大数据领域。该方法为:S1:对商业信息评估涉及的高维数据进行预处理。S2:建立基于ECA‑Net注意力机制和FFM的CatNN,和基于LightGBM作为提升树的GBDT2NN。S3:输入类别型稀疏特征到改进的CatNN,计算其输入和损失函数,得到基于类别型稀疏特征的评估结果。S4:输入数值型稠密特征到改进的GBDT2NN,得到基于数值型稠密特征的评估结果。S5:集成改进的CatNN和GBDT2NN,用于实现高维数据下的商业信息评估。该方法针对高维数据下商业信息评估中涉及的不同类型特征进行了专门的改进处理,且实现了评估模型的在线更新。
-
公开(公告)号:CN118194046A
公开(公告)日:2024-06-14
申请号:CN202410399864.9
申请日:2024-04-03
Applicant: 重庆邮电大学
IPC: G06F18/214 , G06F18/25 , G06F18/2413
Abstract: 本发明属于数据安全领域,涉及一种针对不平衡样本分布的漏洞分类方法、装置及计算机设备;所述方法包括获取漏洞分类数据集,并从中选出样本数量少的漏洞类别,构建少样本漏洞分类数据集;将少样本漏洞分类数据集的漏洞描述输入到漏洞描述生成模型中;将生成的漏洞描述输入到分类模块中,对漏洞描述进行筛选;将筛选后的漏洞描述、对应的漏洞危险等级、所属的漏洞类别作为新的样本加入漏洞分类数据集中,得到漏洞分类增强数据集;将漏洞危险等级作为外部特征,与漏洞描述特征进行融合表示,构建并训练漏洞描述分类模型,将训练好的模型应用于漏洞分类。本发明解决了安全漏洞分类数据集存在的样本分布不平衡问题。使模型能更好地学会不同类别漏洞之间的差异。
-
-
-
-
-
-
-
-
-