基于transformer的细粒度图像分类方法

    公开(公告)号:CN118135290A

    公开(公告)日:2024-06-04

    申请号:CN202410163900.1

    申请日:2024-02-05

    Abstract: 本发明涉及基于transformer的细粒度图像分类方法。该方法包括以下步骤:S1:使用预处理模块处理原始图像数据集;S2:通过transformer主干网络将图像切分为互不重叠的小图块,并提取每个小图块的特征向量token,同时引入位置编码和class‑token;S3:使用信息丢弃模块对每个token进行打分,过滤掉得分较低的token;S4:通过特征选择模块从每层编码器的输出中筛选出强判别区域,将这些区域进行拼接得到聚合特征,再与class‑token融合;S5:使用分类预测模块对融合特征进行分类预测,构建交叉熵损失函数进行训练,通过不断更新参数和迭代训练,优化模型性能,直至模型收敛。

    一种投影光栅相移生成动态三维测量方法及系统

    公开(公告)号:CN114322841A

    公开(公告)日:2022-04-12

    申请号:CN202111474974.X

    申请日:2021-12-06

    Abstract: 本发明属于运动物体表面形貌动态3D重构领域,具体为一种投影光栅相移生成动态三维测量方法及系统,方法包括对运动物体进行正弦光栅投影和采样;对单帧瞬态采样图像进行傅里叶频谱分析,并生成得到多帧相移图像序列;利用相移算法和相位解包裹算法,对相移光栅序列进行高精度相位求解和相位解包裹,获取采样瞬间物体三维形貌;对物体进360°匀速旋转动态扫描,获取不同扫描角度物体的三维形貌信息;通过三维图像拼接方法对扫描三维特征进行图像拼接,即可获得被测物体360°全景动态三维重构信息。本发明采用图像生成的方式从单帧瞬态采样图像获得多帧相移图像序列,有效提升了测量精度,实现了测量效率与测量精度之间的平衡。

    一种混合卷积神经网络驱动的锂电池多类故障诊断建模方法

    公开(公告)号:CN110308397B

    公开(公告)日:2021-04-02

    申请号:CN201910695409.2

    申请日:2019-07-30

    Abstract: 本发明涉及一种混合卷积神经网络驱动的锂电池多类故障诊断建模方法,属于电池技术领域。利用分数阶傅里叶变换获得实测的和筛选的锂电池精细化故障频谱,构成用于锂电池故障诊断的混合大数据标注样本;设计面向混合锂电池故障样本的全局卷积神经网络,以及分别针对实测的和筛选的锂电池故障数据的局部卷积神经网络,构成混合卷积神经网络锂电池故障诊断模型;通过对卷积神经网络中的全局与局部锂电池故障特征进行学习,并采用全连接分类映射,实现锂电池故障的多分类与定位。该方法提高了电池管理系统可靠性和安全性,减轻了参数众多引起的计算复杂性,解决了多物理耦合诊断模型在实际应用中仅能针对某一类锂电池故障诊断任务的问题。

    一种时域频域联合分析宽光谱相干测量方法及系统

    公开(公告)号:CN110779464A

    公开(公告)日:2020-02-11

    申请号:CN201911125563.2

    申请日:2019-11-18

    Abstract: 本发明属于微纳结构三维表面形貌测量领域,具体为一种时域频域联合分析宽光谱相干测量方法及系统,方法包括获取一系列的采样干涉条纹图像,分别提取像素点所对应的原始扫描信号;对该扫描信号分别进行时域调制度分析,提取出扫描信号的调制度曲线,通过调制度极大值点确定靠近零光程差点的采样点位置,可作为中心点并提取一段相对于中心点对称的扫描信号;将对称扫描信号进行空间频域分析,利用频谱相位信息确定零光程差点的相对位置;结合调制度极大值点位置和零光程差点的相对位置,联合求解得到每个像素点的表面形貌高度,确定被测物体三维表面形貌。本发明采取逐像素的方式求取被测微纳结构的表面形貌高度,其理论测量精度可达亚纳米量级。

    一种归一化互信息准则约束的锂电池故障数据筛选方法

    公开(公告)号:CN110412467A

    公开(公告)日:2019-11-05

    申请号:CN201910696529.4

    申请日:2019-07-30

    Abstract: 本发明涉及一种归一化互信息准则约束的锂电池故障数据筛选方法,属于锂电池故障诊断领域。该方法包括以下步骤:S1:采集数据:通过传感器采集真实锂电池故障数据,使用感知生成网络生成候选锂电池故障数据;S2:采用分数阶傅里叶变换提取锂电池故障数据的特征;S3:采用归一化互信息作为锂电池故障数据的筛选测度,计算真实锂电池故障特征矩阵A与候选锂电池故障特征矩阵B之间的归一化互信息;S4:利用故障诊断实验选取筛选阈值。本发明能够使筛选的锂电池故障数据真实有效,同时还能提高筛选速度,为故障诊断的深度学习方法提供了高质量的数据保障。

    基于交叉注意力融合的视觉语音识别方法及系统

    公开(公告)号:CN118675526A

    公开(公告)日:2024-09-20

    申请号:CN202410729452.7

    申请日:2024-06-06

    Abstract: 本发明涉及一种基于交叉注意力融合的视觉语音识别方法及系统,属于计算机交互技术领域。该方法包括以下步骤:采集和标注视频数据和音频数据;对视频数据进行预处理,提取出嘴部区域的图像帧和相应的面部标志点;使用深度学习模型分别提取图像帧和面部标志点的特征;通过交叉注意力机制融合图像帧和面部标志点的特征;将融合后的特征输入分类器,识别视频中的语音内容。本发明能够有效整合图像帧和面部标志点两种视觉特征,充分利用两种模态之间的互补关系,提升唇读系统的精度和鲁棒性。针对唇语识别需要处理视频中的时序信息,捕捉唇部运动的动态变化的问题,引入时间卷积网络作为序列解码器,能够捕捉视频序列中唇部运动的动态时序变化。

Patent Agency Ranking