基于N-DenseNet和高维mfcc特征的城市声音事件分类方法

    公开(公告)号:CN109949824A

    公开(公告)日:2019-06-28

    申请号:CN201910066335.6

    申请日:2019-01-24

    Applicant: 江南大学

    Abstract: 本发明提供一种基于N-DenseNet和高维mfcc特征的城市声音事件分类方法,其在处理音频数据时能提供更丰富、更有效的特征信息,模型有更强的泛化能力,分类具有更高的准确率。其包括:S1:采集待处理音频数据,对原始音频信号进行预处理,输出音频帧序列;S2:对音频帧序列进行时域和频域分析,提取高维梅尔频率倒谱系数,输出特征向量序列;S3:构建声学模型,并对声学模型进行训练,得到训练好的声学模型;S4:将步骤S2中输出的特征向量序列经过处理后,输入到训练好的声学模型中进行分类识别,得到的识别结果即为声音事件的分类结果;其特征在于:声学模型是以DenseNet模型为基础,结合N阶马尔可夫模型的特点构建的网络模型,即为N阶DenseNet模型。

    高精度大行程大有效台面空间平动精密定位平台

    公开(公告)号:CN110211627B

    公开(公告)日:2023-12-22

    申请号:CN201910397913.4

    申请日:2019-05-14

    Applicant: 江南大学

    Abstract: 本发明提供了一种高精度大行程大有效台面空间平动精密定位平台,其能解决现有空间平动精密定位平台运动行程小、有效台面小、结构工艺性较差且平台的耦合误差与寄生转角较大导致平台定位精度不高的问题。其包括基座、动平台、刚性框架、第一柔性支链、第二柔性支链和电磁驱动器;四个第一柔性支链呈正方形分布在动平台的四周并位于刚性框架内,第一柔性支链、动平台和刚性框架布置在XY平面;第一柔性支链包括两个板面呈纵向设置的第一柔性薄板、四个板面呈纵向设置且与第一柔性薄板垂直的第二柔性薄板、两个板面呈水平设置的第三柔性薄板;第二柔性支链设置在动平台与基座之间,包括双四杆型柔性模块、连接模块和四个四杆型柔性模块。

    高精度空间平动微定位平台

    公开(公告)号:CN109256174B

    公开(公告)日:2023-06-06

    申请号:CN201811323351.0

    申请日:2018-11-08

    Applicant: 江南大学

    Abstract: 本发明提供了一种高精度空间平动微定位平台,其能解决现有集中柔度式微定位平台运动行程小,容易出现应力集中,平台定位精度低的问题。其包括基座、动平台和三个柔性支链,柔性支链的柔性移动副包括两组对称布置的柔性簧片,同组中的两个柔性簧片互相平行,主动副中同组的两个柔性簧片通过刚性连接件一连接,第一被动副和第二被动副结构相同,其两组柔性簧片的一端共同连接在刚性连接件二上,另一端共同连接在刚性连接件三上;主动副的刚性连接件一固接在基座上,柔性簧片和压电陶瓷驱动器分别与第一被动副的刚性连接件二连接;第一被动副的刚性连接件三与第二被动副的刚性连接件二连接,第二被动副的刚性连接件三与动平台固接。

    一种基于DenseNet网络与帧差法特征输入的人体行为识别方法

    公开(公告)号:CN110110624B

    公开(公告)日:2023-04-07

    申请号:CN201910332644.3

    申请日:2019-04-24

    Applicant: 江南大学

    Abstract: 本发明提供一种基于DenseNet网络与帧差法特征输入的人体行为识别方法,其可以在占用较少内存和更少训练时间的基础上,在进行人体行为识别的时候取得较高的准确率。其包括:S1:获得待识别动作视频数据;获取待识别动作视频数据的静态灰度图像序列,利用帧差法生成包含运动主体运动特征的运动帧差图;S2:以DenseNet模型为基础构建骨干网络模型,通过骨干网络模型分别搭建时间流网络和空间流网络;S3:分别训练时间流网络和空间流网络,获得训练好的时间流网络和空间流网络;S4:将静态灰度图像序列的序列作为训练好的空间流网络的输入;将运动帧差图的序列作为训练好的时间流网络的输入,获得行为识别最终结果,完成动作识别操作。

    基于多路卷积神经网络的语音识别方法

    公开(公告)号:CN109272988B

    公开(公告)日:2022-05-24

    申请号:CN201811155813.2

    申请日:2018-09-30

    Applicant: 江南大学

    Abstract: 本发明提供基于多路卷积神经网络的语音识别方法,其能够提取更充分的语音信息,且处理数据量较大的音频数据时,具有更好的拟合性。其包括:S1:输入原始语音并进行处理;S2:提取出反映语音信号特征的关键特征参数,形成特征矢量序列;S3:基于多路卷积神经网络模型为基础、CTC作为损失函数,构建声学模型;多路卷积神经网络的结构包括依次设置的子网络结构、连续的全连接层、CTC损失函数;S4:训练声学模型,得到训练好的声学模型;S5:将待识别的特征矢量序列输入到训练好的声学模型中得到识别结果;S6:以步骤S5中得到的识别结果为基础进行后续的运算,即得到能够以最大概率输出该语音信号的词串,词串即原始语音被识别后的语言文字。

    基于N-DenseNet和高维mfcc特征的城市声音事件分类方法

    公开(公告)号:CN109949824B

    公开(公告)日:2021-08-03

    申请号:CN201910066335.6

    申请日:2019-01-24

    Applicant: 江南大学

    Abstract: 本发明提供一种基于N‑DenseNet和高维mfcc特征的城市声音事件分类方法,其在处理音频数据时能提供更丰富、更有效的特征信息,模型有更强的泛化能力,分类具有更高的准确率。其包括:S1:采集待处理音频数据,对原始音频信号进行预处理,输出音频帧序列;S2:对音频帧序列进行时域和频域分析,提取高维梅尔频率倒谱系数,输出特征向量序列;S3:构建声学模型,并对声学模型进行训练,得到训练好的声学模型;S4:将步骤S2中输出的特征向量序列经过处理后,输入到训练好的声学模型中进行分类识别,得到的识别结果即为声音事件的分类结果;其特征在于:声学模型是以DenseNet模型为基础,结合N阶马尔可夫模型的特点构建的网络模型,即为N阶DenseNet模型。

    基于双特征2-DenseNet并联的城市声音事件分类方法

    公开(公告)号:CN110390952A

    公开(公告)日:2019-10-29

    申请号:CN201910539745.8

    申请日:2019-06-21

    Applicant: 江南大学

    Abstract: 本发明提供基于双特征2-DenseNet并联的城市声音事件分类方法,其具对特征信息具有更高效的融合能力,更高的分类准确率,且具有更强的泛化能力。其包括:S1采集、处理待处理音频数据,输出音频帧序列;S2对音频帧序列进行时域和频域分析,分别输出梅尔频率倒谱系数特征向量序列和伽马通倒谱系数特征向量序列;S3构建分类模型,分类模型中包括以DenseNet模型为基础、结合2阶马尔可夫模型构建的网络模型;分类模型以2阶DenseNet模型为基础构建基础网络,基础网络设置为并联的两路;对分类模型进行训练,得到训练好的分类模型;S4将步骤S2中输出的特征向量序列经过处理后,以双特征形式分为两路输入到训练好的分类模型中进行分类识别,得到声音事件的分类结果。

    高精度大行程大有效台面空间平动精密定位平台

    公开(公告)号:CN110211627A

    公开(公告)日:2019-09-06

    申请号:CN201910397913.4

    申请日:2019-05-14

    Applicant: 江南大学

    Abstract: 本发明提供了一种高精度大行程大有效台面空间平动精密定位平台,其能解决现有空间平动精密定位平台运动行程小、有效台面小、结构工艺性较差且平台的耦合误差与寄生转角较大导致平台定位精度不高的问题。其包括基座、动平台、刚性框架、第一柔性支链、第二柔性支链和电磁驱动器;四个第一柔性支链呈正方形分布在动平台的四周并位于刚性框架内,第一柔性支链、动平台和刚性框架布置在XY平面;第一柔性支链包括两个板面呈纵向设置的第一柔性薄板、四个板面呈纵向设置且与第一柔性薄板垂直的第二柔性薄板、两个板面呈水平设置的第三柔性薄板;第二柔性支链设置在动平台与基座之间,包括双四杆型柔性模块、连接模块和四个四杆型柔性模块。

    基于卷积神经网络的语音识别方法

    公开(公告)号:CN109272990A

    公开(公告)日:2019-01-25

    申请号:CN201811112506.6

    申请日:2018-09-25

    Applicant: 江南大学

    Abstract: 本发明提供基于卷积神经网络的语音识别方法,其更加擅长提取高层特征,建模过程简单、容易训练、模型的泛化性能更佳,能够更广泛的应用到各种语音识别的场景中。其包括:S1:对输入的原始语音信号进行预处理;S2:提取出反映语音信号特征的关键特征参数,形成特征矢量序列;S3:基于DCNN网络模型为基础、以联结主义时间分类器CTC作为损失函数,构建端对端方式的声学模型;S4:训练声学模型,得到训练好的声学模型;S5:将步骤S2中得到的待识别的特征矢量序列输入到训练好的声学模型中得到识别结果;S6:以步骤S5中得到的识别结果为基础进行后续的运算,即得到能够以最大概率输出该语音信号的词串,词串即原始语音被识别后的语言文字。

    基于耦合场结构优化的高压脉冲电场杀菌系统的共场处理室

    公开(公告)号:CN102415599A

    公开(公告)日:2012-04-18

    申请号:CN201110359035.0

    申请日:2011-11-14

    Abstract: 本发明公开了一种基于耦合场结构优化的高压脉冲电场杀菌系统的共场处理室,它由2个金属空心管状电极和1个绝缘体隔离管组成,采用了基于耦合场结构优化设计,消除了电极附近存在的尖峰电场,避免了因局部电场过高引起的“放电”问题,同时也保证了处理室内电场分布的均匀性,并将高电场强度集中在物料流经的主要区域内,改善了处理室内物料的流动特性,处理室内温度分布情况也得到了良好的改善,并可以实时监控处理室的温度变化,便于杀菌过程的温度数据采集与分析,并对杀菌过程中出现的温度异常报警。本发明具有安全、高效、经济等优点,可以促进高压脉冲电场杀菌技术由实验室应用转向中试规模及商业化的应用。

Patent Agency Ranking