-
公开(公告)号:CN116486794A
公开(公告)日:2023-07-25
申请号:CN202310386820.8
申请日:2023-04-12
Applicant: 南通大学
Abstract: 本发明涉及语音处理技术领域,具体涉及一种中英混合语音识别方法。本发明包括以下步骤:步骤S1、对中英混合音频通过预处理得到声学特征,利用Conformer模型分别对中英文特征部分嵌入相对位置信息进行编码学习,接着将编码学习后的特征混合输入到解码器部分;步骤S2、使用预训练生成模型的解码器部分作为GPT‑Decoder解码器,同时由GPT‑Decoder解码器、联结时序分类CTC模块及长短时记忆循环神经网络LSTM‑RNNLM模型组成联合解码器;其中,联结时序分类CTC模块和长短时记忆循环神经网络LSTM‑RNNLM模型辅助GPT‑Decoder解码器进行解码。本发明中的编码器部分引入Conformer模型作为中英双编码器,替换传统的Transformer编码器。本发明中的解码器部分采用联合解码器形式代替原有单一的解码器结构。
-
公开(公告)号:CN115171733A
公开(公告)日:2022-10-11
申请号:CN202210757977.2
申请日:2022-06-29
Applicant: 南通大学
Abstract: 本发明涉及抑郁症检测技术领域,尤其涉及一种基于特征融合的音频抑郁症检测方法。包括以下步骤:步骤S1、对包含抑郁症患者的音频数据集进行预处理,并且将预处理后的音频数据集有序划分为训练集和测试集;步骤S2、进行音频特征提取,提取梅尔频率倒谱系数MFCC特征、共振峰特征、过零率特征以及能量特征;步骤S3、将梅尔频率倒谱系数MFCC特征、共振峰特征、过零率特征以及能量特征进行融合输入网络模型当中,对训练集进行学习,得到训练模型,识别其抑郁程度;步骤S4、使用测试集对改进的模型进行测试,完成检测。本发明提出的多特征融合的抑郁症患者语音识别,所选特征容易提取,计算量较小,节约内存,计算速度快,预测结果更加精准。
-
公开(公告)号:CN117811829A
公开(公告)日:2024-04-02
申请号:CN202410040695.X
申请日:2024-01-11
Applicant: 南通大学
IPC: H04L9/40 , G06F21/55 , G06F18/2135 , G06F18/214 , G06F18/2433 , G06F18/2411 , G06F18/243 , G06N3/0455 , G06N20/10 , G06N20/20
Abstract: 本发明涉及计算机数据安全监控技术领域,具体涉及一种基于大数据的计算机数据安全监控方法。本发明目的是提供一种基于大数据的计算机数据安全监控方法,通过建立的异常模型数据库,实时对从未出现过的异常特征进行记录,并通过机械训练的方式将新的异常特征和相应的处理措施进行捆绑存储在异常模型数据库存中,实时提高对异常情况的处理能力,能够接受新的异常情况。本发明通过建立异常模型数据库能够对所有的异常情况进行记录,同时对异常特征进行独特标记,引入了深度学习技术,通过训练大型神经网络模型,独特的异常标记进行识别,最后将新的异常特征与相对应的应对措施进行捆绑,存储在异常模型数据库,提高了对复杂异常模式的识别能力。
-
公开(公告)号:CN116386609A
公开(公告)日:2023-07-04
申请号:CN202310399570.1
申请日:2023-04-14
Applicant: 南通大学
Abstract: 本发明涉及语音处理技术领域,尤其涉及一种中英混合语音识别方法,包括:步骤S1、对中英混合音频通过预处理得到声学特征,利用Conformer模型分别对中英文特征部分嵌入相对位置信息进行编码学习,接着将编码学习后的特征混合输入到解码器部分;步骤S2、使用预训练生成模型的解码器部分作为GPT‑Decoder解码器,同时由GPT‑Decoder解码器、联结时序分类CTC模块及长短时记忆循环神经网络LSTM‑RNNLM模型组成联合解码器;其中,联结时序分类CTC模块和长短时记忆循环神经网络LSTM‑RNNLM模型辅助GPT‑Decoder解码器进行解码。本发明中的编码器部分引入Conformer模型作为中英双编码器,替换传统的Transformer编码器。本发明中的解码器部分采用联合解码器形式代替原有单一的解码器结构,有效提高中英混合语音识别的准确率和效率。
-
公开(公告)号:CN115171878A
公开(公告)日:2022-10-11
申请号:CN202210759072.9
申请日:2022-06-29
Applicant: 南通大学
Abstract: 本发明涉及抑郁症检测技术领域,尤其涉及基于BiGRU和BiLSTM的抑郁症检测方法。包括以下步骤:步骤S1、构建训练样本集,所述训练样本集包含抑郁症和非抑郁症患者的音频和对应的文本信息,按照9:1的比例划分训练集和测试集;步骤S2、采用vggish网络模型进行音频特征提取并训练,提取梅尔语谱图特征,获得具备情景感知的语音向量特征;步骤S3、进行文本特征提取并训练,对所述训练样本集的患者测试文本进行句子级嵌入处理,获得文本特征;步骤S4、使用双向门循环单元BiGRU和双向长短期记忆网络BiLSTM模型,对所述语音向量特征和所述文本特征进行融合,从而进行抑郁症的分析判断;步骤S5、使用测试集对改进的模型进行测试,完成检测。
-
公开(公告)号:CN117422995A
公开(公告)日:2024-01-19
申请号:CN202311357298.7
申请日:2023-10-19
Applicant: 南通大学
IPC: G06V20/10 , G06N3/044 , G06N3/0475 , G06N3/094 , G06V10/764 , G06V10/82 , G06N3/045
Abstract: 本发明涉及人工智能神经网络技术领域,尤其涉及基于改进循环生成对抗网络的城市道路检测算法。本发明包括以下步骤:S1、采集大量城市遥感图像,以及大量标注后的城市道路图像;该两类图像无需对应成对;S2、对两类图像进行预处理,构建训练集和测试集,训练集包括遥感图像、标注图像、以及进行高斯模糊处理后的两类图像;S3、将训练集输入改进的循环生成对抗网络,生成器模型对图像通过进行下采样对图像特征进行提取,并上采样成原大小;S4、将生成器的生成图像和高斯模糊图像一起输入到判别器中,进行判断处理;S5、训练并优化模型,测试集测试模型性能;S6、对城市遥感图像处理后,输入进训练好的模型,实现城市遥感图像的道路标注。
-
公开(公告)号:CN115456981A
公开(公告)日:2022-12-09
申请号:CN202211073636.X
申请日:2022-09-02
Applicant: 南通大学
IPC: G06T7/00 , G06N3/04 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明涉及人工智能神经网络技术领域,尤其涉及一种基于深度残差收缩网络的眼病诊断方法,包括:S1:采集病人结构化、脱敏眼科图像集据作为样本数据,并对眼部数据根据病情进行类别标注;S2:对采集的眼部图像进行预处理;S3:构建训练集和测试集,采用分层抽样算法对训练集中眼部样本数据进行采样,均衡样本数据;S4:将训练集输入深度残差收缩网络,对深层特征进行多尺度提取,去除噪声,输出分类结果;S5:训练并优化模型,测试集测试模型性能,实现眼部疾病诊断。本发明采用注意力机制,抽取出更加关键及重要的信息,使模型做出更加准确的判断;使用软阈值化,减少噪声影响;采用分层抽样和交叉熵损失函数优化算法,提高训练和预测的准确度。
-
公开(公告)号:CN221551158U
公开(公告)日:2024-08-16
申请号:CN202322966081.8
申请日:2023-11-03
Applicant: 南通大学
IPC: G06F1/18 , F16F15/02 , F16F15/067 , F16F15/023
Abstract: 本实用新型公开了一种计算机主板固定装置,具体涉及计算机主板固定技术领域,包括固定架,固定架包括两个U形结构的固定框,固定框内侧固定有U形挡板,固定框前表面靠近其四个拐角处均固定有L形挡板,伸缩组件,伸缩组件用于调节两个固定框之间的间距,伸缩组件包括滑动杆,滑动杆的一侧呈矩形阵列一体化成型有若干个齿牙。本实用新型通过设置固定框、滑杆、U形挡板、L形挡板以及限位组件使得计算机主板可以被快速固定在U形挡板和L形挡板之间,大大提高了计算机主板拆装时的便捷度。
-
-
-
-
-
-
-