-
公开(公告)号:CN114612961B
公开(公告)日:2023-04-07
申请号:CN202210138130.6
申请日:2022-02-15
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V40/16 , G06V10/774
Abstract: 本发明公开了一种多源跨域表情识别方法、装置及存储介质,方法包括:将预处理后的图像数据划分为源域数据和目标域数据;获取源域数据一致性标签,包括基于源域数据原有的标签学习一个标注模型,用于自动对源域数据进行重新标注;利用基于类别原型的度量学习方法学习跨域不变的特征表示,用于提高源域和目标域特征表示判别性,以及减小特征表示的差异性;对表情识别模型进行训练;将目标域数据输入训练好的表情识别模型中,得到目标域数据的最佳预测标签。本发明可从多个源域数据学习语义知识并将其迁移到目标域数据,提升跨域表情识别方法的泛化性能。
-
公开(公告)号:CN114155873A
公开(公告)日:2022-03-08
申请号:CN202111630541.9
申请日:2021-12-28
Applicant: 哈尔滨工业大学(深圳)
IPC: G10L21/0272 , G10L21/0208 , G10L21/0224 , G10L25/30
Abstract: 本发明公开了一种基于细粒度编码的语音分离方法、装置及存储介质,该方法包括粗分离阶段和细分离阶段,粗分离阶段先在单阶隐域所定义的粗粒度编码空间中初步分离混合语音,细分离阶段利用细粒度编码机制,将已存在的单阶隐域分解为高阶隐域,构建一个细粒度的编码空间,从而对初步分离的结果实现更加细粒度的特征分离。本发明设计了一个逐步细化的语音分离框架,可提供更精细的语音分离。
-
公开(公告)号:CN114155873B
公开(公告)日:2025-04-08
申请号:CN202111630541.9
申请日:2021-12-28
Applicant: 哈尔滨工业大学(深圳)
IPC: G10L21/0272 , G10L21/0208 , G10L21/0224 , G10L25/30
Abstract: 本发明公开了一种基于细粒度编码的语音分离方法、装置及存储介质,该方法包括粗分离阶段和细分离阶段,粗分离阶段先在单阶隐域所定义的粗粒度编码空间中初步分离混合语音,细分离阶段利用细粒度编码机制,将已存在的单阶隐域分解为高阶隐域,构建一个细粒度的编码空间,从而对初步分离的结果实现更加细粒度的特征分离。本发明设计了一个逐步细化的语音分离框架,可提供更精细的语音分离。
-
公开(公告)号:CN114612961A
公开(公告)日:2022-06-10
申请号:CN202210138130.6
申请日:2022-02-15
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V40/16 , G06V10/774 , G06K9/62
Abstract: 本发明公开了一种多源跨域表情识别方法、装置及存储介质,方法包括:将预处理后的图像数据划分为源域数据和目标域数据;获取源域数据一致性标签,包括基于源域数据原有的标签学习一个标注模型,用于自动对源域数据进行重新标注;利用基于类别原型的度量学习方法学习跨域不变的特征表示,用于提高源域和目标域特征表示判别性,以及减小特征表示的差异性;对表情识别模型进行训练;将目标域数据输入训练好的表情识别模型中,得到目标域数据的最佳预测标签。本发明可从多个源域数据学习语义知识并将其迁移到目标域数据,提升跨域表情识别方法的泛化性能。
-
-
-