-
公开(公告)号:CN113362299A
公开(公告)日:2021-09-07
申请号:CN202110619088.5
申请日:2021-06-03
Applicant: 南通大学
Abstract: 本发明公开了一种基于改进YOLOv4的X光安检图像检测方法,S1.建立含有违禁品的X光安检图像数据集,并将数据集分为训练集和测试集;S2.利用K‑means++聚类算法设置数据集的先验框;S3.搭建YOLOv4网络模型,包含利用GHM‑C改进YOLOv4的置信度损失函数;S4.利用训练集对改进的YOLOv4模型进行训练得到X光安检图像检测模型;S5.利用测试集对X光安检图像检测模型进行测试。使用GHM‑C loss代替YOLOv4中的置信度损失函数,通过降低简单负样本和非常困难的异常样本的权重,使模型更加专注于那些更为有效的正常困难样本,从而解决样本不平衡问题以提升模型的性能。
-
公开(公告)号:CN116386609A
公开(公告)日:2023-07-04
申请号:CN202310399570.1
申请日:2023-04-14
Applicant: 南通大学
Abstract: 本发明涉及语音处理技术领域,尤其涉及一种中英混合语音识别方法,包括:步骤S1、对中英混合音频通过预处理得到声学特征,利用Conformer模型分别对中英文特征部分嵌入相对位置信息进行编码学习,接着将编码学习后的特征混合输入到解码器部分;步骤S2、使用预训练生成模型的解码器部分作为GPT‑Decoder解码器,同时由GPT‑Decoder解码器、联结时序分类CTC模块及长短时记忆循环神经网络LSTM‑RNNLM模型组成联合解码器;其中,联结时序分类CTC模块和长短时记忆循环神经网络LSTM‑RNNLM模型辅助GPT‑Decoder解码器进行解码。本发明中的编码器部分引入Conformer模型作为中英双编码器,替换传统的Transformer编码器。本发明中的解码器部分采用联合解码器形式代替原有单一的解码器结构,有效提高中英混合语音识别的准确率和效率。
-
公开(公告)号:CN113990409B
公开(公告)日:2024-09-24
申请号:CN202111232532.4
申请日:2021-10-22
Applicant: 南通大学
IPC: G16C20/30 , G16C20/70 , G06F18/213 , G06F18/23213 , G06F18/27
Abstract: 本发明提供了一种基于混合特征选择的辛烷值损失预测方法,属于石油化工技术领域。解决了现有的辛烷值损失测定方法成本高、耗时大的问题。其技术方案为:该预测方法包括如下步骤:S1:获取从催化裂化汽油精制装置采集的样本原始数据;S2:将数据样本进行预处理;S3:使用k‑means聚类算法初步筛选变量:S4:使用皮尔逊相关系数检验变量的线性关系,并用距离相关系数检验变量的非线性关系,将与其它变量相关性较高的变量剔除:S5:根据决策树计算的各变量重要性,得到建模的最终变量;S6:根据辛烷值损失和筛选的变量,建立多元线性回归模型并进行训练。本发明的有益效果为:可以使建模的主要变量具有代表性和独立性。
-
公开(公告)号:CN115602161A
公开(公告)日:2023-01-13
申请号:CN202211295191.X
申请日:2022-10-21
Applicant: 南通大学(CN)
IPC: G10L15/197 , G10L15/16 , G10L15/06 , G10L15/00 , G10L15/26 , G06F16/33 , G06F16/35 , G06F40/216 , G06F40/289 , G06F18/2411 , G06N20/10
Abstract: 本发明属于语音及文本处理领域,具体涉及一种中文语音增强识别及文本纠错矫正方法,包括:对待识别音频进行预处理,通过声纹模型进行特征提取并建立初始粗糙方言鉴别模型;建立初始网络模型对初始粗糙方言鉴别模型进行训练得到方言鉴别模型;基于N‑gram语言模型确定纠错候选分词集合;通过Bigram2元语言模型和N‑gram语言模型进行纠错矫正后输出文本。本发明对待识别音频进行预处理,减少语音识别干扰因素,采用GMM‑SVM模型提高了识别性能,采用GMM‑UBM模型和LSTM模型的组合模型建立初始网络模型拥有更快更好的训练拟合效果,通过N‑gram语言模型和Bigram2元语言模型进行文本处理纠错有效降低了错误率,优化了待识别音频转换成文本信息的结果。
-
公开(公告)号:CN113990409A
公开(公告)日:2022-01-28
申请号:CN202111232532.4
申请日:2021-10-22
Applicant: 南通大学
Abstract: 本发明提供了一种基于混合特征选择的辛烷值损失预测方法,属于石油化工技术领域。解决了现有的辛烷值损失测定方法成本高、耗时大的问题。其技术方案为:该预测方法包括如下步骤:S1:获取从催化裂化汽油精制装置采集的样本原始数据;S2:将数据样本进行预处理;S3:使用k‑means聚类算法初步筛选变量:S4:使用皮尔逊相关系数检验变量的线性关系,并用距离相关系数检验变量的非线性关系,将与其它变量相关性较高的变量剔除:S5:根据决策树计算的各变量重要性,得到建模的最终变量;S6:根据辛烷值损失和筛选的变量,建立多元线性回归模型并进行训练。本发明的有益效果为:可以使建模的主要变量具有代表性和独立性。
-
公开(公告)号:CN113362299B
公开(公告)日:2023-09-12
申请号:CN202110619088.5
申请日:2021-06-03
Applicant: 南通大学
IPC: G06V20/52 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/762
Abstract: 本发明公开了一种基于改进YOLOv4的X光安检图像检测方法,S1.建立含有违禁品的X光安检图像数据集,并将数据集分为训练集和测试集;S2.利用K‑means++聚类算法设置数据集的先验框;S3.搭建YOLOv4网络模型,包含利用GHM‑C改进YOLOv4的置信度损失函数;S4.利用训练集对改进的YOLOv4模型进行训练得到X光安检图像检测模型;S5.利用测试集对X光安检图像检测模型进行测试。使用GHM‑C loss代替YOLOv4中的置信度损失函数,通过降低简单负样本和非常困难的异常样本的权重,使模型更加专注于那些更为有效的正常困难样本,从而解决样本不平衡问题以提升模型的性能。
-
公开(公告)号:CN115271205A
公开(公告)日:2022-11-01
申请号:CN202210897779.6
申请日:2022-07-28
Applicant: 南通大学
Abstract: 本发明涉及智能计算技术领域,尤其涉及一种基于Dijkstra算法的最短物流路径规划方法,包括:S1:用迪杰斯拉Dijkstra算法计算配送中心到所有配送点的最短距离和路径信息;S2:解析路径信息,得到配送中心到各配送点最短距离的路径;S3:基于路径信息求覆盖所有可到达点的最少往返趟数的配送路径;S4:基于S1中的配送中心到所有配送点的最短距离和S3得到最短配送路程。本发明首先基于Dijkstra算法计算出的配送点到各配送点最短距离路径,给出往返配送次数最少的配送方案,然后基于该配送方案计算出总的配送路程;本发明能够减少物流成本,提高物流时效性,降低人力,可以有效提高生产率。
-
公开(公告)号:CN115271205B
公开(公告)日:2023-11-28
申请号:CN202210897779.6
申请日:2022-07-28
Applicant: 南通大学
IPC: G06Q10/047 , G06Q10/0835
Abstract: 本发明涉及智能计算技术领域,尤其涉及一种基于Dijkstra算法的最短物流路径规划方法,包括:S1:用迪杰斯拉Dijkstra算法计算配送中心到所有配送点的最短距离和路径信息;S2:解析路径信息,得到配送中心到各配送点最短距离的路径;S3:基于路径信息求覆盖所有可到达点的最少往返趟数的配送路径;S4:基于S1中的配送中心到所有配送点的最短距离和S3得到最短配送路程。本发明首先基于Dijkstra算法计算出的配送点到各配送点最短距离路径,给出往返配送次数最少的配送方案,然后基于该配送方案计算出总的配送路程;本发明能够减少物流成本,提高物流时效性,降低人力,可以有效提高生产率。
-
公开(公告)号:CN116486794A
公开(公告)日:2023-07-25
申请号:CN202310386820.8
申请日:2023-04-12
Applicant: 南通大学
Abstract: 本发明涉及语音处理技术领域,具体涉及一种中英混合语音识别方法。本发明包括以下步骤:步骤S1、对中英混合音频通过预处理得到声学特征,利用Conformer模型分别对中英文特征部分嵌入相对位置信息进行编码学习,接着将编码学习后的特征混合输入到解码器部分;步骤S2、使用预训练生成模型的解码器部分作为GPT‑Decoder解码器,同时由GPT‑Decoder解码器、联结时序分类CTC模块及长短时记忆循环神经网络LSTM‑RNNLM模型组成联合解码器;其中,联结时序分类CTC模块和长短时记忆循环神经网络LSTM‑RNNLM模型辅助GPT‑Decoder解码器进行解码。本发明中的编码器部分引入Conformer模型作为中英双编码器,替换传统的Transformer编码器。本发明中的解码器部分采用联合解码器形式代替原有单一的解码器结构。
-
公开(公告)号:CN115171733A
公开(公告)日:2022-10-11
申请号:CN202210757977.2
申请日:2022-06-29
Applicant: 南通大学
Abstract: 本发明涉及抑郁症检测技术领域,尤其涉及一种基于特征融合的音频抑郁症检测方法。包括以下步骤:步骤S1、对包含抑郁症患者的音频数据集进行预处理,并且将预处理后的音频数据集有序划分为训练集和测试集;步骤S2、进行音频特征提取,提取梅尔频率倒谱系数MFCC特征、共振峰特征、过零率特征以及能量特征;步骤S3、将梅尔频率倒谱系数MFCC特征、共振峰特征、过零率特征以及能量特征进行融合输入网络模型当中,对训练集进行学习,得到训练模型,识别其抑郁程度;步骤S4、使用测试集对改进的模型进行测试,完成检测。本发明提出的多特征融合的抑郁症患者语音识别,所选特征容易提取,计算量较小,节约内存,计算速度快,预测结果更加精准。
-
-
-
-
-
-
-
-
-