-
公开(公告)号:CN119887641A
公开(公告)日:2025-04-25
申请号:CN202411860083.1
申请日:2024-12-17
Applicant: 内蒙古工业大学
IPC: G06T7/00 , G06V20/70 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于改进RT‑DETR的轻量化公路路面缺陷检测方法,获取公路路面缺陷数据集并对将其划分为训练集、验证集和测试集;设计改进RT‑DETR的轻量化公路路面缺陷检测模型;利用改进后的RT‑DETR网络训练获取的公路路面缺陷数据集,得到训练好的权重;利用改进后的RT‑DETR网络将训练好的权重用于测试集的图像处理并获得检测结果。本发明解决了现有公路路面缺陷检测模型计算量、参数量大导致检测速度较慢的问题,提高了公路路面缺陷检测任务的成功率和准确性。
-
公开(公告)号:CN119445188A
公开(公告)日:2025-02-14
申请号:CN202411286817.X
申请日:2024-09-13
Applicant: 内蒙古工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/52 , G06N3/0455 , G06N3/0464
Abstract: 一种基于Swin Transformer的花粉分类方法,获取花粉图像,并进行标注;构建分类模型,包括条形卷积缩放模块、骨干网络、全连接层和分类头;条形卷积缩放模块用于将输入的花粉图像进行缩放;骨干网络基于Swin Transformer编码器,分为级联的四个阶段,用于采集花粉图像中的花粉特征,其中,在第一阶段和第二阶段,阶段的输入特征均分别经过窗口多头自注意力模块和大视野空间双边注意力模块,再融合后经过移位窗口多头自注意力模块,得到阶段的输出特征;第四阶段输出最终的花粉特征;所述全连接层和分类头基于所述最终的花粉特征进行分类;训练所述分类模型,并利用训练完成的分类模型进行花粉分类。
-
公开(公告)号:CN118506442A
公开(公告)日:2024-08-16
申请号:CN202410537693.1
申请日:2024-04-30
Applicant: 内蒙古工业大学
IPC: G06V40/20 , G06V40/10 , G06V10/143 , G06V10/44 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 一种基于特征聚合和软分界策略的跨模态行人重识别方法,构建基于ResNet‑50的端到端双流网络模型,模型包括两个单模态特征网络和一个模态共享特征网络;利用部分级特征提取方法,将从模态共享特征网络中得到的3D特征图均匀切分成多个部分;利用重要性特征聚合模块根据各段粗略的部分级局部特征提取行人具有辨别性的特征,利用公开数据集,以软分界中心三元组损失函数和带有标签平滑操作的身份损失函数联合训练模型;利用训练后的模型,进行可见光‑红外光跨模态行人重识别。本发明能够进一步提升跨模态行人重识别的准确率。
-
公开(公告)号:CN118053173A
公开(公告)日:2024-05-17
申请号:CN202410062676.7
申请日:2024-01-16
Applicant: 内蒙古工业大学
Abstract: 本发明公开了一种基于关键点检测的羊脸对齐与识别方法和系统,方法包括:采集羊脸面部数据,羊脸面部数据包括面部关键点被遮挡和均未被遮挡的图像;在各图像中通过人工方式标注出羊脸位置以及未被遮挡的面部关键点位置,并将数据分为测试集和训练集;检测得到羊脸面部在图像中的具体位置;构建关键点检测模型,检测面部关键点;当检测到面部关键点均未被遮挡,采用以两眼连线中心为基准的羊脸对齐算法进行羊脸对齐;当检测到面部关键点被遮挡,采用以四点连线交叉反向延伸中心为基准的羊脸对齐算法进行羊脸对齐。本发明解决了面部关键点受到遮挡的问题,可实现羊脸精确识别。
-
公开(公告)号:CN117291194A
公开(公告)日:2023-12-26
申请号:CN202311180085.1
申请日:2023-09-13
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06F40/253 , G06F40/30 , G06N3/0455 , G06N3/0895
Abstract: 一种基于蒙古语格成分掩码数据增强的蒙汉神经机器翻译方法,结合蒙古语的语法规则进行蒙古语格成分分析与标注;采用不同的掩码方法对蒙古语格成分进行掩码数据增强,同时以源端和目标端为条件预测被掩码的词;通过语义编码器将汉语和数据增强后的蒙古语的语义信息映射在同一个向量空间,并生成包含多个具有相似语义的蒙古语和汉语的向量表示的邻接语义区域;在该区域中对样本采样,使用广播网络集成到翻译模型的解码器进行解码;翻译模型采用Transformer‑XL模型,在进行解码时,将每个解码器模块的输出动态结合在一起;将原样本与数据增强后的样本一同训练,并利用训练好的翻译模型进行蒙汉机器翻译。本发明可扩充训练语料规模,提升翻译质量。
-
公开(公告)号:CN116704050A
公开(公告)日:2023-09-05
申请号:CN202310767459.3
申请日:2023-06-27
Applicant: 内蒙古工业大学
Abstract: 一种基于显著性特征的彩色图像颜色转移方法,分别获得原始图像的显著性特征图和参考图像的显著性特征图;根据显著性特征图阈值处理,将原始图像划分为显著性区域和非显著性区域,将参考图像划分为显著性区域和非显著性区域;在显著性区域和非显著性区域,分别根据方差和显著性值的加权平均值,将参考图像的颜色信息转移到输入图像,本发明能够进一步提高彩色图像颜色转移的效果。
-
公开(公告)号:CN116682413A
公开(公告)日:2023-09-01
申请号:CN202310851534.4
申请日:2023-07-12
Applicant: 内蒙古工业大学
Abstract: 一种基于Conformer和MelGAN的蒙古语语音合成方法,获取蒙古语文本数据,提取文本特征,将文本特征编码转换为音素序列,并将所述音素序列输入至BERT预训练模型;利用BERT预训练模型训练蒙古文音素信息,学习发音中的韵律特征,并将音素信息对齐;利用基于轻量级Conformer模块的FastSpeech2声学模型,通过音素信息并行生成声学特征,即Mel频谱图;利用基于GAN的轻量级模型MelGAN作为声码器,在其中添加蒙古语语音特征,将Mel频谱图推理转换为语音波形,从而实现蒙古语语音合成,本发明可提高蒙古语语音合成的速度与合成语音的自然度。
-
公开(公告)号:CN113657124B
公开(公告)日:2023-06-30
申请号:CN202110792912.7
申请日:2021-07-14
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06F40/44 , G06V10/82 , G06N3/0464 , G06V10/80 , G06N3/084 , G06N3/0442 , G06N3/045
Abstract: 一种基于循环共同注意力Transformer的多模态蒙汉翻译方法,利用YOLO‑V4对输入图像进行目标检测,通过相关性检测对比蒙古文本与目标标签,保留与蒙古文本相关的目标图像,并利用编码层将蒙古文本编码为张量;利用重参数化VGG网络和三重注意力机制提取并关注目标图像特征,采用形变双向长短期记忆网络对目标图像特征与编码后的蒙古文本特征即张量分别进行数次交互,之后送入到循环共同注意力Transformer网络中进行蒙汉翻译,通过数次循环交互,将蒙古语言特征与视觉特征充分融合,输出目标语言。本发明从视觉和语言两个角度捕获特征信息,通过多轮循环,可有效的提高翻译质量,解决蒙古文翻译质量不佳的问题。
-
公开(公告)号:CN110967112B
公开(公告)日:2022-05-10
申请号:CN201911266023.6
申请日:2019-12-11
Applicant: 内蒙古工业大学
Abstract: 本申请涉及一种面向色盲的照明光谱获取方法、装置及设备,方法包括:首先获取目标物体的表面反射率;然后根据所述表面反射率和预设照明光谱得到所述目标物体在所述预设照明光谱下的特殊光照三刺激值;再利用预设评价函数对所述特殊光照三刺激值进行评价,得到评价结果;当所述评价结果为满足预设条件时,将所述预设照明光谱输出为目标光谱;当所述评价结果为不满足预设条件时,更新所述预设照明光谱。基于此,便可以利用评价函数得到满足预设条件的目标光谱。
-
公开(公告)号:CN112395892B
公开(公告)日:2022-03-18
申请号:CN202011393623.1
申请日:2020-12-03
Applicant: 内蒙古工业大学
Abstract: 一种基于指针生成网络实现占位符消歧的蒙汉机器翻译方法,基于编码器‑解码器架构,其特征在于,还包括辅助网络和骨干网络,所述辅助网络为每个输入源词汇位置生成一个二进制门,动态地选择要关注的词汇,所述骨干网络为带有门控机制的注意力的指针生成网络;编码阶段,经编码器的词嵌入层,将源文编码成一个隐藏层状态,再由所述门控机制决定来自当前状态的信息是流入还是被占位符替换;解码阶段,利用指针生成网络复制源文能力和生成新词汇能力,搭配占位符上下文语境进行消歧,给出符合上下文语义的精准词义,在最后数据输出前,利用附加模块进行语言学检查,检测到可能翻译异常的情况做出标注,通过调整相关参数以达到最好的翻译效果。
-
-
-
-
-
-
-
-
-