-
公开(公告)号:CN110288984A
公开(公告)日:2019-09-27
申请号:CN201910414675.3
申请日:2019-05-17
Applicant: 南昌大学
IPC: G10L15/12 , G10L15/02 , G10L21/0216 , G10L21/0208
Abstract: 本发明公开了一种基于Kinect的语音识别方法,包括以下步骤:使用Kinect for Windows v2产品的麦克风阵列对用户发出的语音信号进行采集;通过对麦克风阵列采集到的音频信息进行分析比对,进而对用户的音源位置进行确定;基于Kinect for Windows v2产品,对采集到的音频信息进行处理,包括有背景去噪、回声消除和自动增益控制音频;使用DTW算法对处理后的音频信息进行特征提取;将特征提取后的音频信息与内置的音频模板进行匹配;对匹配后的音频信息进行解码。本发明使用Kinect的语音识别系统,代替了用于机器人身上的传统基于PC机的语音识别系统,基于Kinect的语音识别系统会更加经济实用,Kinect具有成本低廉、轻巧简单、精准度较高等优点,能够对语音进行有效识别。
-
公开(公告)号:CN110149480A
公开(公告)日:2019-08-20
申请号:CN201910444872.X
申请日:2019-05-27
Applicant: 南昌大学
IPC: H04N5/232 , H04N7/18 , H04N21/432 , H04N21/643 , H04N21/647
Abstract: 本发明公开了一种视频图像处理及传输系统,包括有摄像头模块、视频图像处理模块和视频图像传输模块,摄像头模块与视频图像处理模块通信连接,视频图像处理模块与视频图像传输模块通信连接;视频图像处理模块用于抽取视频中的帧图像,并获得含有大量有用信息量的目标图像,视频图像处理模块包括有图像预处理单元和图像分割单元;视频图像传输模块用于实现视频图像的可靠传输。本发明通过视频图像处理模块的设计,可用于抽取视频中的帧图像,去除图像中由外界环境所掺入的大量无用信息,减少其对图像的干扰,从而获得含有大量有用信息量的目标图像,提高了视频的质量,有利于视频中重要事物的识别。
-
公开(公告)号:CN209982600U
公开(公告)日:2020-01-21
申请号:CN201920775052.4
申请日:2019-05-27
Applicant: 南昌大学
IPC: H04N5/232 , H04N7/18 , H04N21/643 , H04N21/432 , H04N21/647
Abstract: 本实用新型公开了一种视频图像处理及传输系统,包括有摄像头模块、视频图像处理模块和视频图像传输模块,摄像头模块与视频图像处理模块通信连接,视频图像处理模块与视频图像传输模块通信连接;视频图像处理模块用于抽取视频中的帧图像,并获得含有大量有用信息量的目标图像,视频图像处理模块包括有图像预处理单元和图像分割单元;视频图像传输模块用于实现视频图像的可靠传输。本实用新型通过视频图像处理模块的设计,可用于抽取视频中的帧图像,去除图像中由外界环境所掺入的大量无用信息,减少其对图像的干扰,从而获得含有大量有用信息量的目标图像,提高了视频的质量,有利于视频中重要事物的识别。(ESM)同样的发明创造已同日申请发明专利
-
-