-
公开(公告)号:CN117994813A
公开(公告)日:2024-05-07
申请号:CN202410019578.5
申请日:2024-01-05
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种无人机图像中的二维人体关键点检测方法,所述方法首先以无人机图像数据为基础,采用了一种Mosaic数据增强方法;另外,在backbone中采用了稠密连接结构。其次,构建了一个双向特征提取模块,用于直接从俯拍视角的图片中直接获取各种空间视角的人体姿态,进行全方位人体姿态估计,引入Swish激活函数,缓解梯度消失的情况,以满足在无人机图片中对多角度的小目标人体进行精确姿态估计的目的。
-
公开(公告)号:CN116610831A
公开(公告)日:2023-08-18
申请号:CN202310684445.5
申请日:2023-06-09
Applicant: 中国电子科技集团公司第五十四研究所 , 桂林电子科技大学
IPC: G06F16/583 , G06F18/22 , G06N5/04 , G06N3/09
Abstract: 本发明提供了一种语义细分及模态对齐推理学习跨模态检索方法、检索系统,本发明的语义细分及模态对齐推理学习跨模态检索方法包括如下步骤:将预训练后得到的原始模态特征基于缩放点积注意力进行模态对齐,以实现为原始特征重新聚合投影模态对齐特征;将上述步骤形成的所述模态对齐数据通过权重共享的多层感知机后,再采用语义近似匹配与正确匹配的方法实现对于相同类别标签簇的语义正确匹配与近似匹配挖掘;采用Arc4cmr损失函数、相互监督对比损失函数、图文特征相似度矩阵和相似标签矩阵间的对比损失函数进行模型约束。本发明的跨模态检索方法进一步提升了跨模态检索的准确性。
-
公开(公告)号:CN113392575B
公开(公告)日:2023-06-20
申请号:CN202110532763.0
申请日:2021-05-17
Applicant: 桂林电子科技大学
IPC: G06F30/27 , G06N20/20 , G06F111/08 , G06F113/06
Abstract: 本发明公开了一种基于滑窗特征的风机主轴故障预测方法,主要包括:(1)采用如XGBoost、GBDT、CatBoost、LightGBM算法等模型进行特征的自动选择以及特征的非线性转换;(2)使用原始风机特征训练风机的时序特性问题,对风机时间特征进行提取,并将数据集进行分割切片。(3)基于滑动窗口对故障标签、风机状态特征处理,完成滑窗特征的构造。(4)采用stacking集成策略,对各个模型的预测结果进行加权计算。本发明设计了一系列可以表征当前风机运行状态的滑窗特征,通过构造滑窗特征的方式解决风机特征单一和故障状态缓变特性问题,最后将融合滑窗特征后的模型与使用原始风机特征训练的模型进行对比,显现出预测效果有一定程度的提升。
-
公开(公告)号:CN115527094A
公开(公告)日:2022-12-27
申请号:CN202211328913.7
申请日:2022-10-27
Applicant: 桂林电子科技大学
Abstract: 本发明提供了一种目标检测方法以及检测系统,所述检测方法包括:采用主干特征提取网络,对输入的图片进行特征提取得到特征图;对所述特征图进行多分支空洞卷积注意力处理,加强感兴趣信息的特征表示,经过双向特征金字塔结构,丰富不同层级的特征信息;利用所述双向特征金字塔结构产生的多尺度特征对目标的位置和类别进行预测。本发明的目标检测方法,通过多尺度注意力特征金字塔网络和广义交并比损失函数(GIoU),捕获多尺度上下文信息,将高层特征和低层特征有效融合,丰富不同层级的特征信息,使模型更加准确地定位和识别感兴趣的物体,从而进一步提高目标检测的精度。
-
公开(公告)号:CN113011476B
公开(公告)日:2022-11-11
申请号:CN202110242716.2
申请日:2021-03-05
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于自适应滑动窗口GAN的用户行为安全检测方法,利用Spark平台对获取的用户数据进行并行化处理,并使用GAN分别训练不同时间窗口下的正常用户行为模型;利用当前窗口长度处理获取的待检测数据,并将当前时刻的所述待检测数据与上一时刻数据做属性相似度计算;利用所述正常用户行为模型根据计算出的相似度值进行检测,并将得到的异常评分与设定的阈值进行比较,判断当前时间段是否正常,使用GAN作为无监督的异常行为检测器,结合使用自适应滑动窗口技术对时序数据进行处理,提高了检测准确率。
-
公开(公告)号:CN115114975A
公开(公告)日:2022-09-27
申请号:CN202210578157.7
申请日:2022-05-25
Applicant: 桂林电子科技大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06V10/762 , G06V10/764 , G06V10/778 , G06V10/80 , G06V10/82 , G06V40/16 , G06V40/20 , G10L15/14 , B25J9/16
Abstract: 本发明公开了一种基于交互学习的多模态融合机械臂控制方法,该方法利用深度学习相关技术对多模态信息进行分析和处理,从而使得系统可以获取用户完整且精确的意图。通过隐马尔科夫模型(HMM)对语音命令进行准确识别处理;使用动态时间规整算法(DTW)实现对动态手势识别的研究;利用基于特征融合的表情识别算法来提取表情图像特征并进行特征融合,通过对表情进行识别达到对心理状态的判定,获取其心理意图。此外,本方法以人机交互为基础,通过决策树和Q‑Learning算法学习新命令和新知识,同时利用学习到的正确信息对原有的知识进行更新,实现机械臂自身知识的智能增长,从而实现对机械臂控制的优化。
-
公开(公告)号:CN111695507B
公开(公告)日:2022-08-16
申请号:CN202010532751.3
申请日:2020-06-12
Applicant: 桂林电子科技大学
IPC: G06V40/20 , G06V40/10 , G06V10/77 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08 , G06F16/51 , G06F16/55 , G06F16/583
Abstract: 本发明公开了一种基于改进VGGNet网络的静态手势识别方法,该方法将VGGNet网络进行改进,使用不同的分支来学习标签信息,同时在网络中引入哈希层将手势图像的特征投影到汉明空间,通过计算汉明距离来提高处理手势的效率。将改进后的VGGNet网络和传统的主成分分析方法相结合来进行手势识别,首先将原始数据集和增强后的数据集作为输入数据对VGGNet网络进行训练,得到手势图像的高维特征,然后通过主成分分析法PCA将高维图像特征进行降维,减小特征向量长度,缩短图像之间的相似性度量的计算时间,从而提高提高手势识别的精度和效率。
-
公开(公告)号:CN114861601A
公开(公告)日:2022-08-05
申请号:CN202210473365.0
申请日:2022-04-29
Applicant: 桂林电子科技大学 , 中国电子科技集团公司第五十四研究所
IPC: G06F40/126 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于旋转式编码的事件联合抽取方法,所述方法使用了融合旋转式编码的BERT模型解决文本过长无法全部放入预训练模型提取特征的手段;以及使用了加入自注意力机制的BiLSTM捕获相关的时序特征和上下文关系,从多角度获得文本中字符间关联权重表示来更准确地关注句子中的重要字符或单词,丰富文本的语义信息的手段;还有在模型训练过程中通过对抗训练加入扰动提升文本语义多样性,提高模型的鲁棒性和泛化能力的手段;通过上述三个方面提高了事件抽取的准确率和召回率。
-
公开(公告)号:CN114818904A
公开(公告)日:2022-07-29
申请号:CN202210422554.5
申请日:2022-04-21
Applicant: 桂林电子科技大学
Abstract: 本发明提供了一种基于Stack‑GANs模型的风机故障检测方法,所述方法包括以风电机组工况参数构成的风机数据集,并通过Stack‑GANs模型处理后输入到风机故障检测模型中,得到检测结果。本发明利用Stack‑GANs算法在处理风机数据不平衡问题上的有效性,减少数据集类别不平衡对风机故障检测带来的负面效果,提高了风机故障检测的效率和准确度。
-
公开(公告)号:CN113190602B
公开(公告)日:2022-03-25
申请号:CN202110380536.0
申请日:2021-04-09
Applicant: 桂林电子科技大学 , 中国电子科技集团公司第五十四研究所
IPC: G06F16/25 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合字词特征与深度学习的事件联合抽取方法,所述方法把事件类型和事件元素当作一个联合标签进行标注,减少了流水线误差。通过延拓MacBERT解决文本按字符切分过长无法全部放入预训练模型提取特征的问题,再结合字符和单词的特征,动态地捕获输入序列任意字符和单词之间的依赖关系,更加充分获取文本的语义信息和字、词特征;在模型训练过程中加入扰动去干扰CRF解码,通过对抗训练的方式提高模型的泛化性和健壮性。从减少流水线误差、获取文本更全面的语义信息和加入对抗训练提高模型泛化性三个方面提高事件抽取的准确率和召回率。
-
-
-
-
-
-
-
-
-