基于可分离卷积块和空间缩减注意力机制的图像分类方法

    公开(公告)号:CN117422919A

    公开(公告)日:2024-01-19

    申请号:CN202311428350.3

    申请日:2023-10-31

    Abstract: 本发明涉及一种基于可分离卷积块和空间缩减注意力机制的图像分类方法,属于图像分类领域。将交叉深度可分离卷积和经过改进的空间缩减注意力机制加入到PVT模型中,减少模型训练时间,并且在减少注意力计算时计算量的同时基本不损失特征图的原始信息。搭建基于交叉深度可分离卷积块嵌入和空间缩减注意力机制的网络模型,包括块嵌入模块,线性投影模块,位置信息嵌入模块以及空间缩减注意力机制模块;进行图像分类,以提升在图像分类时的计算速率以及保留原始边界信息。从而达到整体的提升效果。本发明有效地改善了模型计算量巨大以及图像边界信息丢失等问题,减少了模型的计算量以及提升了模型分类性能。

    一种基于DualGCN的文本情感分析方法

    公开(公告)号:CN116402059A

    公开(公告)日:2023-07-07

    申请号:CN202310392221.7

    申请日:2023-04-13

    Abstract: 本发明涉及一种基于DualGCN的文本情感分析方法,属于文本分析领域。该方法为:首先对文本进行预处理,使用预训练的Glove词嵌入,利用BERT作为encoder来挖掘句子的隐藏状态向量,利用生成树提供的短语级语法结构和依赖树从句语法结构的信息,替代以往仅从依赖树获取语法结构信息,考虑到方面之间的影响,将依赖树结构和组成树结构的融合,解决了方面级情感分析长距离依赖问题;增加了GCN中每一层的感受野。最后通过语法模块和语义模块的信息交流,由softmax来输出分类结果。该方法利用了语法结构的信息,缓解了GCN容易出现的过度平滑现象,能有效提高分类的精度。

    一种结合图像描述和文本生成图像的视觉语言导航方法

    公开(公告)号:CN117571014A

    公开(公告)日:2024-02-20

    申请号:CN202311520271.5

    申请日:2023-11-15

    Abstract: 本发明涉及一种结合图像描述和文本生成图像的视觉语言导航方法,属于视觉语言导航技术领域。该方法为:获取视觉语言导航任务的自然语言目标指令和当前所处位置的视觉图像;通过场景描述模块生成基于当前场景的详尽自然语言描述;通过文本生成图像模型生成与所描述场景有着类似核心物品对象以及核心场景布局的相似场景;将当前场景和对应相似场景通过多层Transformer结构和细尺度跨模态编码器进行编码;将当前场景编码和相似场景编码动态融合生成综合考虑了当前真实场景和对应相似场景的融合动作预测。该方法通过为任务训练提供额外的视觉数据输入,解决了视觉语言导航任务的数据稀缺问题,提高了智能体的任务性能和模型的泛化能力。

    基于多尺度注意力和双编码器的遥感图像语义分割方法

    公开(公告)号:CN117496151A

    公开(公告)日:2024-02-02

    申请号:CN202311529262.2

    申请日:2023-11-16

    Abstract: 本发明涉及基于多尺度注意力和双编码器的遥感图像语义分割方法,属于遥感图像语义分割技术领域。将Swin Transformer嵌入到基于CNN的残差网络中,形成并行的双编码器。关系聚合模块作为桥梁传递信息,利用全局特征引导主编码器获得更多的判别特征。通过具有高效通道注意力模块的多尺度跳跃连接,以利用多尺度特征并获得通道间的关系。位置注意力模块,获取任意两个位置特征图之间的空间依赖性,提高类内相关性和语义一致性。搭建基于多尺度注意力和双编码器的遥感图像语义分割网络模型。本发明有效的改善了语义分割中类内差异大,类间差异小等问题,显著得提高了语义分割模型的性能。

    一种基于三元组自编码器的室内位置指纹定位方法

    公开(公告)号:CN116321008A

    公开(公告)日:2023-06-23

    申请号:CN202310392222.1

    申请日:2023-04-13

    Abstract: 本发明涉及一种基于三元组自编码器的室内位置指纹定位方法,属于定位技术领域。该方法为:利用WIFI接收器在每个位置获得一组WIFI信号强度数据,得到每个位置点的WIFI信号强弱;使用高斯滤波的方式对已经采集到的数据进行预处理;构造基于自编码器的三元组神经网络及损失函数和用于最后定位的BP神经网络;将经过预处理室内位置指纹数据集训练构造好的三元组自编码器,保留网络模型的结构和参数;使用特征提取网络提取预处理后的数据集,得到降维后的数据集,训练BP神经网络,将特征提取网络和训练后的BP神经网络保存为Tri‑Sae模型;该方法解决了特征提取难度大、定位精度低、坏数据较多等问题。

    一种基于DualGCN的文本情感分析方法

    公开(公告)号:CN116402059B

    公开(公告)日:2024-12-10

    申请号:CN202310392221.7

    申请日:2023-04-13

    Abstract: 本发明涉及一种基于DualGCN的文本情感分析方法,属于文本分析领域。该方法为:首先对文本进行预处理,使用预训练的Glove词嵌入,利用BERT作为encoder来挖掘句子的隐藏状态向量,利用生成树提供的短语级语法结构和依赖树从句语法结构的信息,替代以往仅从依赖树获取语法结构信息,考虑到方面之间的影响,将依赖树结构和组成树结构的融合,解决了方面级情感分析长距离依赖问题;增加了GCN中每一层的感受野。最后通过语法模块和语义模块的信息交流,由softmax来输出分类结果。该方法利用了语法结构的信息,缓解了GCN容易出现的过度平滑现象,能有效提高分类的精度。

Patent Agency Ranking