一种基于全局-局部对比学习的跨语言自然语言理解方法

    公开(公告)号:CN116227498B

    公开(公告)日:2025-05-13

    申请号:CN202211571399.X

    申请日:2022-12-08

    Abstract: 本发明涉及一种基于全局‑局部对比学习的跨语言自然语言理解方法,属于自然语言处理技术领域。该方法针对自然语言理解模型的高性能跨语言迁移需求,研究基于全局‑局部对比学习网络的跨语言自然语言理解方法,主要包括三个模块:局部句子级意图对比学习模块,针对意图检测任务实现跨语言句子表示对齐;局部字符级槽位对比学习模块,针对槽位填充任务实现跨语言字符表示对齐;语义级全局意图‑槽位对比学习模块,实现意图和槽位间的表示对齐。本发明能够学习不同层级的细粒度对齐信息,挖掘出丰富的语义特征,缩小原始语言与目标语言之间的预测差异。

    基于交叉注意力融合的视觉语音识别方法及系统

    公开(公告)号:CN118675526A

    公开(公告)日:2024-09-20

    申请号:CN202410729452.7

    申请日:2024-06-06

    Abstract: 本发明涉及一种基于交叉注意力融合的视觉语音识别方法及系统,属于计算机交互技术领域。该方法包括以下步骤:采集和标注视频数据和音频数据;对视频数据进行预处理,提取出嘴部区域的图像帧和相应的面部标志点;使用深度学习模型分别提取图像帧和面部标志点的特征;通过交叉注意力机制融合图像帧和面部标志点的特征;将融合后的特征输入分类器,识别视频中的语音内容。本发明能够有效整合图像帧和面部标志点两种视觉特征,充分利用两种模态之间的互补关系,提升唇读系统的精度和鲁棒性。针对唇语识别需要处理视频中的时序信息,捕捉唇部运动的动态变化的问题,引入时间卷积网络作为序列解码器,能够捕捉视频序列中唇部运动的动态时序变化。

    一种基于多模态BiLSTM-Mamba的锂电池热预警方法

    公开(公告)号:CN118587159A

    公开(公告)日:2024-09-03

    申请号:CN202410623653.9

    申请日:2024-05-20

    Abstract: 本发明涉及一种基于多模态BiLSTM‑Mamba的锂电池热预警方法,属于锂电池热预警领域。该方法包括:采集锂电池的红外图像、热成像图像、电池内部电流、电压以及电池温度数据;将红外图像和热成像图像输入Vision Transformer神经网络对图像进行处理,提取温度特征并进行锂电池表面温度的预测;将电流、电压以及温度数据输入CNN‑BiLSTM神经网络中进行特征提取和学习,综合多个特征表示以预测锂电池表面温度;最后耦合两个神经网络的预测温度,并输入Mamba模型中预测热预警,以达到防止热失控的目的。本发明可提高锂电池热失控预警的准确性和可靠性,能够更快更精准地得到预测结果。

    基于多头注意力机制和时延神经网络的语音识别方法

    公开(公告)号:CN117672218A

    公开(公告)日:2024-03-08

    申请号:CN202311591964.3

    申请日:2023-11-27

    Abstract: 本发明涉及一种基于多头注意力机制和时延神经网络的语音识别方法,属于语音识别技术领域。本发明针对已有低资源语音识别模型单一,长序列上下文依赖捕获能力差、局部特征提取能力不足的问题。本发明将通过对比学习、时延神经网络等方法提高自监督低资源语音识别模型特征提取能力。针对目标域标注数据稀缺的情景,传统的低资源语音识别模型由于训练数据和测试数据的不匹配的影响,通常难以在高维潜在空间中找到更加理想的片段语音到字元的维特比对齐,最终导致了模型的健壮性不理想。本研究拟定通过数据增强的方法对未标注数据进行理想分布拓展,降低了未标注数据的概念偏移量,加强了未标注数据的可靠性。

    一种基于收缩和空间交互网络的锂电池荷电状态估计方法

    公开(公告)号:CN116184224A

    公开(公告)日:2023-05-30

    申请号:CN202211550581.7

    申请日:2022-12-05

    Abstract: 本发明涉及一种基于收缩和空间交互网络的锂电池荷电状态估计方法,属于新能源技术领域。该方法包括以下步骤:S1:使用锂电池电流、电压、温度和采样时间序列中的一个或多个作为模型输入,在残差网络的基础上,将软阈值作为非线性转换层插入到深层架构中,以消除不重要的特征,实现去噪的目的,获得新的特征矩阵作为下一模块的输入;S2:使用上一模块将数据去噪处理后的特征矩阵X'作为数据输入,空间交互网络学习数据间的依赖关系,最终输出锂电池的荷电状态。本发明利用简单卷积和交互网络提取时序数据特征的同时增加各个子序列之间的联系,进而提升模型学习时序数据前后相关性的能力,完成锂电池荷电状态的准确估计。

    一种结合DSIFT和自适应图像分块的多聚焦图像融合方法

    公开(公告)号:CN111127375B

    公开(公告)日:2023-04-07

    申请号:CN201911223803.2

    申请日:2019-12-03

    Abstract: 本专利提出一种基于密集尺度不变特征变换和四叉树自适应分块相结合的多聚焦图像融合。该方法基于源图像的密集尺度不变特征变换获得128维密集描述符,通过叠加所有密集描述符实现源图像活动水平的测量;在四叉树结构内对源图像进行分块,并且根据图像块对的聚焦情况决定该块对的分割,从而实现图像块大小的自适应选取,同时生成图像融合决策图;最后根据图像融合决策图直接复制源图像中的聚焦区域像素值生成完全聚焦的融合图像。该方法的融合图像的像素直接复制源图像聚焦区域的像素保留了更多源图像原始信息,自适应图像分块降低图像块方法的“块效应”,从而提高融合图像的视觉效果。

    数据驱动的输入输出含噪声Hammerstein非线性系统偏差校正辨识方法

    公开(公告)号:CN115407653A

    公开(公告)日:2022-11-29

    申请号:CN202210937129.X

    申请日:2022-08-05

    Abstract: 本发明涉及一种数据驱动的输入输出含噪声Hammerstein非线性系统偏差校正辨识方法,属于控制理论与控制工程非线性系统辨识领域。该方法包括:S1:采集系统观测输入数据和观测输出数据;S2:构建Hammerstein非线性系统可解释重构模型;S3:处理Hammerstein非线性系统噪声与系统数据,解耦噪声作用;S4:利用二维搜索方法求解系统噪声方差;S5:利用最小二乘偏差校正方法求解系统参数辨识。本发明采用系统观测输入输出数据,基于可解释的重构模型,避免参数估计过程的偏差,提高模型精度,提供一致估计。

    基于多任务学习的问答方法

    公开(公告)号:CN109885671B

    公开(公告)日:2022-10-14

    申请号:CN201910152570.5

    申请日:2019-02-28

    Abstract: 本发明涉及一种基于多任务学习的问答方法,属于人工智能领域,包括步骤:S1:为每个任务配备特定于任务的siamese编码器,将预处理后的句子编码为分布式向量表示;S2:利用一个共享的表示学习层在不同的任务之间共享高级信息;S3:特定于任务的softmax层分类,对于第k个任务中的问答对及其标签最后的特征表示形式被输入特定于任务的softmax层进行二进制分类;S4:多任务学习:训练多任务学习模型,使交叉熵损失函数最小化。本发明利用从不同角度学习到的多视图注意力,使这些任务能够相互作用,学习更全面的句子表示,多视角注意方案还可以有效地从不同的表征视角收集注意信息,提高表征学习的整体水平。

Patent Agency Ranking