-
公开(公告)号:CN110390952B
公开(公告)日:2021-10-22
申请号:CN201910539745.8
申请日:2019-06-21
Applicant: 江南大学
Abstract: 本发明提供基于双特征2‑DenseNet并联的城市声音事件分类方法,其具对特征信息具有更高效的融合能力,更高的分类准确率,且具有更强的泛化能力。其包括:S1采集、处理待处理音频数据,输出音频帧序列;S2对音频帧序列进行时域和频域分析,分别输出梅尔频率倒谱系数特征向量序列和伽马通倒谱系数特征向量序列;S3构建分类模型,分类模型中包括以DenseNet模型为基础、结合2阶马尔可夫模型构建的网络模型;分类模型以2阶DenseNet模型为基础构建基础网络,基础网络设置为并联的两路;对分类模型进行训练,得到训练好的分类模型;S4将步骤S2中输出的特征向量序列经过处理后,以双特征形式分为两路输入到训练好的分类模型中进行分类识别,得到声音事件的分类结果。
-
公开(公告)号:CN110110624A
公开(公告)日:2019-08-09
申请号:CN201910332644.3
申请日:2019-04-24
Applicant: 江南大学
IPC: G06K9/00
Abstract: 本发明提供一种基于DenseNet网络与帧差法特征输入的人体行为识别方法,其可以在占用较少内存和更少训练时间的基础上,在进行人体行为识别的时候取得较高的准确率。其包括:S1:获得待识别动作视频数据;获取待识别动作视频数据的静态灰度图像序列,利用帧差法生成包含运动主体运动特征的运动帧差图;S2:以DenseNet模型为基础构建骨干网络模型,通过骨干网络模型分别搭建时间流网络和空间流网络;S3:分别训练时间流网络和空间流网络,获得训练好的时间流网络和空间流网络;S4:将静态灰度图像序列的序列作为训练好的空间流网络的输入;将运动帧差图的序列作为训练好的时间流网络的输入,获得行为识别最终结果,完成动作识别操作。
-
公开(公告)号:CN110084292A
公开(公告)日:2019-08-02
申请号:CN201910314505.8
申请日:2019-04-18
Applicant: 江南大学
Abstract: 本发明提供基于DenseNet和多尺度特征融合的目标检测方法,其包括:S1构建特征提取网络模型;S2训练特征提取网络模型,通过多次迭代训练得到最优目标检测模型;S3将待检测图像数据输入到最优目标检测模型进行检测,在待检测图像上用矩形框标注每个物体的位置和类别;特征提取网络模型以DenseNet网络为基础网络,加深了网络层次,提高了特征质量,同时使用特征融合模块,引入上下文信息,得到六个用于最终预测的特征图,具有丰富的语义信息和较高的分辨率。本发明方法可在保证检测速度的基础上,降低模型规模,提升对小目标的检测精度。
-
公开(公告)号:CN109272988A
公开(公告)日:2019-01-25
申请号:CN201811155813.2
申请日:2018-09-30
Applicant: 江南大学
Abstract: 本发明提供基于多路卷积神经网络的语音识别方法,其能够提取更充分的语音信息,且处理数据量较大的音频数据时,具有更好的拟合性。其包括:S1:输入原始语音并进行处理;S2:提取出反映语音信号特征的关键特征参数,形成特征矢量序列;S3:基于多路卷积神经网络模型为基础、CTC作为损失函数,构建声学模型;多路卷积神经网络的结构包括依次设置的子网络结构、连续的全连接层、CTC损失函数;S4:训练声学模型,得到训练好的声学模型;S5:将待识别的特征矢量序列输入到训练好的声学模型中得到识别结果;S6:以步骤S5中得到的识别结果为基础进行后续的运算,即得到能够以最大概率输出该语音信号的词串,词串即原始语音被识别后的语言文字。
-
公开(公告)号:CN109256174A
公开(公告)日:2019-01-22
申请号:CN201811323351.0
申请日:2018-11-08
Applicant: 江南大学
IPC: G12B5/00
Abstract: 本发明提供了一种高精度空间平动微定位平台,其能解决现有集中柔度式微定位平台运动行程小,容易出现应力集中,平台定位精度低的问题。其包括基座、动平台和三个柔性支链,柔性支链的柔性移动副包括两组对称布置的柔性簧片,同组中的两个柔性簧片互相平行,主动副中同组的两个柔性簧片通过刚性连接件一连接,第一被动副和第二被动副结构相同,其两组柔性簧片的一端共同连接在刚性连接件二上,另一端共同连接在刚性连接件三上;主动副的刚性连接件一固接在基座上,柔性簧片和压电陶瓷驱动器分别与第一被动副的刚性连接件二连接;第一被动副的刚性连接件三与第二被动副的刚性连接件二连接,第二被动副的刚性连接件三与动平台固接。
-
公开(公告)号:CN110084292B
公开(公告)日:2023-06-06
申请号:CN201910314505.8
申请日:2019-04-18
Applicant: 江南大学
IPC: G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明提供基于DenseNet和多尺度特征融合的目标检测方法,其包括:S1构建特征提取网络模型;S2训练特征提取网络模型,通过多次迭代训练得到最优目标检测模型;S3将待检测图像数据输入到最优目标检测模型进行检测,在待检测图像上用矩形框标注每个物体的位置和类别;特征提取网络模型以DenseNet网络为基础网络,加深了网络层次,提高了特征质量,同时使用特征融合模块,引入上下文信息,得到六个用于最终预测的特征图,具有丰富的语义信息和较高的分辨率。本发明方法可在保证检测速度的基础上,降低模型规模,提升对小目标的检测精度。
-
-
公开(公告)号:CN109256175A
公开(公告)日:2019-01-22
申请号:CN201811323431.6
申请日:2018-11-08
Applicant: 江南大学
IPC: G12B5/00
Abstract: 本发明提供了一种高精度大行程空间平动微定位平台,其能解决现有集中柔度式微定位平台容易出现应力集中,且难以保证在高精度的前提下实现毫米级的大行程的问题。其包括基座、动平台和三个柔性支链,三个柔性支链呈正交布置,柔性支链的两端分别固接在基座和动平台上,基座上还安装有分别用于驱动柔性支链的音圈电机驱动器,柔性支链包括主动副、第一被动副和第二被动副;主动副、第一被动副和第二被动副均由对称设置的复合型柔性移动副组成,复合型柔性移动副包括两组柔性簧片且同组的两个柔性簧片互相平行,柔性簧片之间通过刚性连接件连接。
-
公开(公告)号:CN109272990B
公开(公告)日:2021-11-05
申请号:CN201811112506.6
申请日:2018-09-25
Applicant: 江南大学
Abstract: 本发明提供基于卷积神经网络的语音识别方法,其更加擅长提取高层特征,建模过程简单、容易训练、模型的泛化性能更佳,能够更广泛的应用到各种语音识别的场景中。其包括:S1:对输入的原始语音信号进行预处理;S2:提取出反映语音信号特征的关键特征参数,形成特征矢量序列;S3:基于DCNN网络模型为基础、以联结主义时间分类器CTC作为损失函数,构建端对端方式的声学模型;S4:训练声学模型,得到训练好的声学模型;S5:将步骤S2中得到的待识别的特征矢量序列输入到训练好的声学模型中得到识别结果;S6:以步骤S5中得到的识别结果为基础进行后续的运算,即得到能够以最大概率输出该语音信号的词串,词串即原始语音被识别后的语言文字。
-
公开(公告)号:CN110689916A
公开(公告)日:2020-01-14
申请号:CN201910991939.1
申请日:2019-10-18
Applicant: 江南大学
Abstract: 本发明提供了一种基于柔性杆的高精度柔性微定位平台,其能解决现有分布柔度式定位平台各支链结构差异较大,不同支链运动性能不够稳定,理论分析较复杂,以及当仅有X或Y方向有运动输入时,还是会产生一定的耦合位移,影响平台运动精度的问题。其包括基座、动平台、四个第一柔性支链和一个第二柔性支链;第一柔性支链由四个双四杆型柔性模块组成,其中三个双四杆型柔性模块并联,再与剩余一个双四杆型柔性模块串联;第二柔性支链由五个双四杆型柔性模块组成,其中四个双四杆型柔性模块并联,再与剩余一个双四杆型柔性模块串联;基座上还分别固定安装有X向电磁驱动器、Y向电磁驱动器和Z向电磁驱动器。
-
-
-
-
-
-
-
-
-