-
公开(公告)号:CN118135631A
公开(公告)日:2024-06-04
申请号:CN202410247707.6
申请日:2024-03-05
Applicant: 山东大学
IPC: G06V40/16 , G06V10/774 , G06V10/764 , G06N3/042 , G06N3/0464 , G06N3/08 , G06V10/82
Abstract: 本发明公开了基于面部关键点的自适应图卷积表情识别方法及系统,其中方法,包括:获取待识别的人脸面部视频,提取视频中每一帧图像的面部关键点,得到待识别人脸面部视频的面部关键点的序列数据;基于面部关键点的序列数据,分别生成面部肌肉的序列数据、面部关键点移动的序列数据以及面部肌肉移动的序列数据;基于面部关键点的序列数据,生成面部关键点图;基于面部肌肉的序列数据,生成面部肌肉图;基于关键点移动的序列数据,生成面部关键点移动图;基于面部肌肉移动的序列数据,生成面部肌肉移动图;将面部关键点图、面部肌肉图、面部关键点移动图和面部肌肉移动图,均输入到训练后的多流自适应图卷积网络中,输出人脸面部表情的分类结果。
-
公开(公告)号:CN118197365A
公开(公告)日:2024-06-14
申请号:CN202410320129.4
申请日:2024-03-20
Applicant: 山东大学
Abstract: 本发明公开了一种基于多尺度卷积的轻量化语音情感识别方法及系统,涉及语音情感识别技术领域。该方法包括步骤:获取待测语音数据并进行预处理,提取待测语音数据的梅尔频率倒谱系数;利用语音情感识别网络对梅尔频率倒谱系数进行处理,得到语音情感识别分类结果,其中,语音情感识别网络中,轻量级多尺度特征提取模块用于在元素级粒度下自适应学习不同尺度的特征并进行多尺度特征提取,多尺度倒谱和时谱注意力模块用于顺序地对梅尔频率倒谱系数的关键倒谱分量和梅尔频率倒谱系数的关键时谱位置进行优化。本发明兼顾了语音情感识别的轻量化与准确率,解决了存储资源和算力受限场景下无法进行高效情感分类的问题。
-
公开(公告)号:CN118118106A
公开(公告)日:2024-05-31
申请号:CN202410274000.4
申请日:2024-03-11
Applicant: 山东大学
Abstract: 本发明公开一种基于深度学习的超宽带信号特征分集接收检测方法及系统,涉及超宽带无线通信技术领域,方法包括:利用压缩矩阵,对脉冲超宽带信号进行特征分集接收,将信号从时域压缩到特征域,获取信号中导频符号和数据符号的特征分集信息;对导频符号的特征分集信息进行平均降噪,得到导频参考信息;基于导频参考信息,对分集合并系数进行加权,得到相关分集合并系数;基于相关分集合并系数,对数据符号的特征分集信息进行内积,得到相关结果;基于相关结果进行判决,得到信号中符号的检测结果;其中,压缩矩阵、分集合并系数、判决方式均通过深度学习训练的神经网络学习获得。本发明优化信号接收检测过程,有效降低了信号采样率和系统复杂度。
-
公开(公告)号:CN117994859A
公开(公告)日:2024-05-07
申请号:CN202410293593.9
申请日:2024-03-14
Applicant: 山东大学
Abstract: 本发明公开一种异常行为检测方法、系统、设备、介质及程序产品,包括:获取连续帧图像序列;对当前帧图像和其下一帧图像,计算二者之间的前向特征差和后向特征差,基于前向特征差和后向特征差,分别计算前向注意力权重和后向注意力权重,得到注意力特征图;根据当前帧图像的特征图对注意力特征图进行加权,并将加权后的注意力特征图与当前帧图像的特征图进行连接,得到当前帧的运动特征图;将所有运动特征图重塑为单特征图,对单特征图沿时间维度进行通道位移,基于通道位移处理后的单特征图进行异常行为的识别。引入双向长时运动注意力模块和时序位移模块,实现对长期运动特征的提取和时域特征的交互,且不增加额外计算成本。
-
-
-