-
公开(公告)号:CN117912070A
公开(公告)日:2024-04-19
申请号:CN202311785612.1
申请日:2023-12-22
Applicant: 北京理工大学珠海学院
IPC: G06V40/16 , G06V10/774 , G06V10/762
Abstract: 本发明提供一种基于伪标签约束耐躁学习的行人重识别方法,其包括在目标域聚类得到的不同类构建类别中心;在得到上述类别中心后,通过将目标域中的所有特征分别与所有类别中心计算距离,并进行归一化,得到一个和为1的向量,作为样本的软标签;基于细粒度化的软标签,设计新的损失函数训练网络,并对伪标签的生成进行约束;其中,所述损失函数包括交叉熵损失、反向交叉熵损失以及三元组损失;在使用多个损失函数训练学习行人重识别网络模型,输入图像数据至训练好的模型,输出识别结果。本发明通过反向交叉熵损失对伪标签生成的方式进行优化,并对生成的标签加以约束,避免过多错误伪标签的产生,使得优化后的网络模型能够提高识别准确率。
-
公开(公告)号:CN117633587A
公开(公告)日:2024-03-01
申请号:CN202311573437.X
申请日:2023-11-23
Applicant: 北京理工大学珠海学院
IPC: G06F18/24 , G10L25/63 , G10L25/30 , G10L25/18 , G06F18/25 , G06N20/00 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明公开涉及基于迁移学习的音频和文本的宽时间范畴情感识别方法,通过使用预训练模型VGGish和BERTbase提取音频和文本两个模态的情感特征,从不同的角度对目标人物的情感进行分析;通过事实描述和文本描述进行情感特征的提取,在宽时间范畴内对目标人物目前的情感状态进行更准确的推理,通过在SVCEmotion数据集的音频和文本描述数据上的实验证明,VGGish和BERTbase预训练模型均能在本文使用的数据集上实现良好的效果,模型在预训练过程中学习到的参数能够有效的提升其在目标任务上的表现;对比实验证明,SVCEmotion数据集中针对宽时间范畴下的情感识别任务引入的情境描述可以为情感识别提供线索,且与事实描述结合能大幅提升情感识别效果。
-