一种图文融合的低秩多模态融合情感分析方法

    公开(公告)号:CN117688936A

    公开(公告)日:2024-03-12

    申请号:CN202410158289.3

    申请日:2024-02-04

    Abstract: 本发明涉及一种图文融合的低秩多模态融合情感分析方法,本发明获取网络平台用户意见图文对数据并制作用户意见图文对数据集;使用双向编码表征模型提取用户意见图文对中的文本特征;使用结构重参数化视觉几何组模型提取用户意见图文对中的图像特征;通过多模态特征融合层对提取出的文本特征和图像特征进行低秩多模态融合,得到多模态融合特征:将多模态融合特征输入情感分类器中进行三分类预测,获取到最终用户情感预测。本发明通过多模态特征融合层对提取出的文本特征和图像特征进行低秩多模态融合,提升了用户意见图文对情感预测的准确性,有效解决了单一模态下情感识别的混淆性,提高了情感模型预测的效果和性能。

    基于语义感知图卷积的三维手物姿态估计方法及系统

    公开(公告)号:CN116486489B

    公开(公告)日:2023-08-29

    申请号:CN202310754065.4

    申请日:2023-06-26

    Abstract: 本发明公开了一种基于语义感知图卷积的三维手物姿态估计方法及系统,使用特征提取网络从彩色图像中提取手感兴趣区域特征和物感兴趣区域特征;基于手感兴趣区域特征估计二维手姿态,基于物感兴趣区域特征估计二维物姿态;将二维手姿态和二维物姿态输入三维姿态估计网络以估计三维手物姿态,所述三维姿态估计网络包括多个共同注意力模块和语义感知图卷积模块。本发明使用语义感知图卷积模块实现了手物全局特征的充分融合,在一定程度上实现了手物交互,并使用多个共同注意力模块对包含不同数目关键点的手物姿态进行关联计算,能够充分建模不同状态下的手物交互关系,有利于手物姿态的准确估计。

    一种基于YOLOv7的小目标检测方法及系统

    公开(公告)号:CN116385810B

    公开(公告)日:2023-08-15

    申请号:CN202310656474.0

    申请日:2023-06-05

    Abstract: 本发明属于深度学习目标检测技术领域,具体涉及一种基于YOLOv7的小目标检测方法及系统,该方法通过基于YOLOv7的小目标检测模型进行小目标检测,所述基于YOLOv7的小目标检测模型的主干网络增加了小目标增强模块;所述小目标增强模块包括两个分支,第一个分支由两个CBS模块和空间到深度操作构成;第二个分支为增强特征提取能力模块,将两个分支提取到的特征进行融合。本发明通过小目标增强模块提取细节特征、丰富小目标的语义信息,提升小目标的检测效果,将CIoU损失函数替换为归一化高斯Wasserstein距离损失。

    基于扩散模型的多模态三维手部网格重建方法

    公开(公告)号:CN119152149A

    公开(公告)日:2024-12-17

    申请号:CN202411645849.4

    申请日:2024-11-18

    Abstract: 本发明属于人体姿态识别技术领域,公开了基于扩散模型的多模态三维手部网格重建方法,通过特征提取模型采集深度图和点云数据,并根据深度图和点云数据提取手部关节特征;将一个初始化的标准高斯分布的噪声连同提取到的手部关节特征一起输入扩散模型中进行迭代去噪,通过多次迭代逐步从噪声中恢复出手部关节位置;根据手部关节位置,通过网格重建模块重建三维手部网格。本发明基于彩色图像,通过融合深度图和三维点云数据,实现了高精度的三维手部网格重建,显著提升了手部姿态重建的速度和准确性。

    基于可变形注意力的三维交互双手重建方法及系统

    公开(公告)号:CN116740290B

    公开(公告)日:2023-11-07

    申请号:CN202311024598.3

    申请日:2023-08-15

    Abstract: 本发明属于图像信息处理技术领域,具体涉及一种基于可变形注意力的三维交互双手重建方法及系统,该方法通过提取多尺度图像特征,并对多尺度图像特征网格采样操作得到图像网格特征;将全局特征向量通过多层感知机初始化为左、右手的顶点令牌、关节令牌和位置嵌入;将图像网格特征和左、右手的顶点令牌、关节令牌和位置嵌入输入到交互块中,三个交互块以从粗到细的方式重建交互手重建网格,交互手重建网格直接回归双手表面顶点的三维坐标,得到交互手重建后的结果。本发明融合图卷积注意力和可变形多头自注意力来建模两只手的局部和全局交互,解决两只手之间的相互遮挡,重建出高质量的交互手重建网格。

    基于可变形注意力的三维交互双手重建方法及系统

    公开(公告)号:CN116740290A

    公开(公告)日:2023-09-12

    申请号:CN202311024598.3

    申请日:2023-08-15

    Abstract: 本发明属于图像信息处理技术领域,具体涉及一种基于可变形注意力的三维交互双手重建方法及系统,该方法通过提取多尺度图像特征,并对多尺度图像特征网格采样操作得到图像网格特征;将全局特征向量通过多层感知机初始化为左、右手的顶点令牌、关节令牌和位置嵌入;将图像网格特征和左、右手的顶点令牌、关节令牌和位置嵌入输入到交互块中,三个交互块以从粗到细的方式重建交互手重建网格,交互手重建网格直接回归双手表面顶点的三维坐标,得到交互手重建后的结果。本发明融合图卷积注意力和可变形多头自注意力来建模两只手的局部和全局交互,解决两只手之间的相互遮挡,重建出高质量的交互手重建网格。

    长文本生成图像的方法及系统

    公开(公告)号:CN116503517A

    公开(公告)日:2023-07-28

    申请号:CN202310764770.2

    申请日:2023-06-27

    Abstract: 本发明提供了一种长文本生成图像的方法及系统,该方法包括:在潜在空间中随机获取一特征向量,并将所述特征向量输入至预设全连接层中,以生成对应的初始特征图;通过预设融合块和预设融合器将预设长文本特征对应融合至所述初始特征图中,以生成对应的中间特征图;依次通过预设卷积层和预设激活层对所述中间特征图进行图像化处理,以生成对应的目标图像,所述目标图像包含所述预设长文本特征中的特征元素。通过上述方式能够将外界的长文本特征对应融合至随机生成的初始特征图中,并最终根据该初始特征图生成需要的目标图像,并且该目标图像包含与上述长文本特征对应的特征元素,即对应的场景图像。

    基于语义感知图卷积的三维手物姿态估计方法及系统

    公开(公告)号:CN116486489A

    公开(公告)日:2023-07-25

    申请号:CN202310754065.4

    申请日:2023-06-26

    Abstract: 本发明公开了一种基于语义感知图卷积的三维手物姿态估计方法及系统,使用特征提取网络从彩色图像中提取手感兴趣区域特征和物感兴趣区域特征;基于手感兴趣区域特征估计二维手姿态,基于物感兴趣区域特征估计二维物姿态;将二维手姿态和二维物姿态输入三维姿态估计网络以估计三维手物姿态,所述三维姿态估计网络包括多个共同注意力模块和语义感知图卷积模块。本发明使用语义感知图卷积模块实现了手物全局特征的充分融合,在一定程度上实现了手物交互,并使用多个共同注意力模块对包含不同数目关键点的手物姿态进行关联计算,能够充分建模不同状态下的手物交互关系,有利于手物姿态的准确估计。

Patent Agency Ranking