-
公开(公告)号:CN119251502A
公开(公告)日:2025-01-03
申请号:CN202411332093.8
申请日:2024-09-24
Applicant: 桂林电子科技大学
IPC: G06V10/26 , G06V10/82 , G06N3/0895 , G06N3/096 , G06V10/80 , G06V10/774
Abstract: 本发明公开了一种基于数据融合和知识蒸馏的数据分布优化方法。包括步骤:设计一个包含三个神经网络的半监督学习训练框架;对输入的图像使用图像级双向复制粘贴进行浅层特征融合;在频率域使用频率复制粘贴,通过交换图像的幅值频谱整合频域的数据信息;引入知识蒸馏设计损失函数,用于模型训练。本发明有效减小了数据之间的分布,大大提高了半监督医学分割任务的精度,在多个公开数据集上的实验结果表明,与之前的最好结果相比,有显著性能提升。
-
公开(公告)号:CN116886049A
公开(公告)日:2023-10-13
申请号:CN202310862924.1
申请日:2023-07-14
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种可编程人工智能机的离散傅里叶变换模拟信号处理方法。包括1)设计参数任意可调的信号处理系统;2)根据需求生成离散傅里叶变换算法参数、数据集;3)将离散傅里叶变换算法参数加载到模拟信号处理层;4)配置电磁波调制层,将待处理信号信息调制到电磁波上;5)进行评估与校准。这种方法只需要简单的超材料系统和极低的时间与能量开销就能实现对模拟信号高速地进行离散傅里叶变换操作,这种基于可编程人工智能机的设计能更快速地完成对输入信号的处理,且大大减少计算系统的成本需求。
-
公开(公告)号:CN117347946A
公开(公告)日:2024-01-05
申请号:CN202311062990.7
申请日:2023-08-22
Applicant: 桂林电子科技大学
IPC: G01S5/02 , G06F18/214 , G06F18/24 , G06N20/00
Abstract: 本发明涉及一种基于非线性框架字典学习的超表面定位方法及装置,旨在解决现有技术中存在的稀疏表示及字典学习问题是基于线性建模,而定位问题用线性建模不能最高效的拟合,导致定位精度的下降的技术问题。本发明包括:获取带有标签矩阵的目标区域内的训练目标的定位数据;结合标签矩阵方法和字典学习方法构建字典学习模型和目标分类模型,并基于所述字典学习模型和所述目标分类模型的结合加入非线性函数,计算出所述定位数据的判别字典和目标区域内的分类参数;基于所述判别字典,运用稀疏编码方法获取待定位目标的稀疏系数;基于所述稀疏系数,结合所述分类参数,得到待定位目标的位置信息。
-
公开(公告)号:CN116129326A
公开(公告)日:2023-05-16
申请号:CN202310160041.6
申请日:2023-02-23
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于局部和全局注意力机制的视频动作识别方法。包括步骤:设计一个局部建模模块,在非重叠窗口内局部计算自注意,该窗口划分了一个标记映射,它从小的三维领域的局部时空上下文中提取特征;在局部建模模块中嵌入卷积前馈神经网络,用于捕获局部连续性和位置信息;设计一个全局建模模块,在像素级标记上应用注意力机制,每个转置的标记都抽象全局信息;在全局建模模块中嵌入跳跃连接的卷积层,组成基于卷积神经网络和Transformer的网络LGATNet;不使用预训练,LGATNet在动作识别的公开数据集上进行模型参数学习,并在测试集输出对应的测试结果。本发明有效利用了多尺度特征信息,大大提高了动作识别的准确性和实时性。
-
-
-