-
公开(公告)号:CN118262012A
公开(公告)日:2024-06-28
申请号:CN202410689213.3
申请日:2024-05-30
Applicant: 江西农业大学
IPC: G06T11/60 , G06N3/0475 , G06N3/094 , G06N3/0464 , G06N3/045 , G06N3/0985 , G06V20/70 , G06F40/30 , G06F18/22 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明属于图像处理技术领域,具体涉及一种基于特征定位融合的文本编辑图像系统及方法,该系统的生成器包括多个深度注意力编辑块、特征定位模块和卷积层,各深度注意力编辑块逐个串联;除第一个深度注意力编辑块外的其他深度注意力编辑块,每个深度注意力编辑块的输入为前一个深度注意力编辑块输出的图像特征、由文本编码器编码的文本特征和由特征定位模块输出的图像定位特征,最后一个深度注意力编辑块输出的图像特征进入卷积层,卷积层将图像特征转换为生成图像。本发明能够准确地定位和识别图像中的不同部分,并将它们与文本描述进行匹配,提高图像编辑的准确性。
-
公开(公告)号:CN117688936B
公开(公告)日:2024-04-19
申请号:CN202410158289.3
申请日:2024-02-04
Applicant: 江西农业大学
IPC: G06F40/242 , G06F40/216 , G06F16/35
Abstract: 本发明涉及一种图文融合的低秩多模态融合情感分析方法,本发明获取网络平台用户意见图文对数据并制作用户意见图文对数据集;使用双向编码表征模型提取用户意见图文对中的文本特征;使用结构重参数化视觉几何组模型提取用户意见图文对中的图像特征;通过多模态特征融合层对提取出的文本特征和图像特征进行低秩多模态融合,得到多模态融合特征:将多模态融合特征输入情感分类器中进行三分类预测,获取到最终用户情感预测。本发明通过多模态特征融合层对提取出的文本特征和图像特征进行低秩多模态融合,提升了用户意见图文对情感预测的准确性,有效解决了单一模态下情感识别的混淆性,提高了情感模型预测的效果和性能。
-
公开(公告)号:CN117649610A
公开(公告)日:2024-03-05
申请号:CN202410122712.4
申请日:2024-01-30
Applicant: 江西农业大学
IPC: G06V20/10 , G06V20/40 , G06V10/44 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于YOLOv5的害虫检测方法及系统,该方法包括:从摄像头采集的视频画面中截取图像,输入到改进的YOLOv5检测模型进行害虫检测,获取害虫的类别和数量信息,所述改进的YOLOv5检测模型,以YOLOv5s为基础模型,将主干网络和颈部网络中的C3模块替换成C3NCBAM模块,所述C3NCBAM模块由C3模块中添加NCBAM模块构成,所述NCBAM模块由改进坐标注意力模块和空间注意力模块串联构成。本发明将YOLOv5s中的C3模块替换成C3CBAM模块,以提高模型的特征提取能力、检测的准确性和速度。
-
公开(公告)号:CN118172648B
公开(公告)日:2024-07-23
申请号:CN202410591602.2
申请日:2024-05-14
Applicant: 江西农业大学
IPC: G06V10/82 , G06V10/44 , G06N3/0464 , G06N3/08
Abstract: 本发明属于图像识别技术领域,公开了一种基于双向曲形状态空间模型的手网格重建系统及方法,该手网格重建系统,包括编码器和解码器,所述编码器包括若干个双向曲形状态空间模型构成的第一编码阶段、第二编码阶段、第三编码阶段、第四编码阶段;所述解码器包括以若干个双向曲形状态空间模型构成的第一解码阶段、第二解码阶段、第三解码阶段、第四解码阶段;所述双向曲形状态空间模型包括特征重构、远程依赖学习及特征复原。本发明基于双向曲形状态空间模型和残差连接构建了一个浅、深层特征充分融合的U型架构,重建手网格的特征既具备较强的远程依赖,又富含细节信息。
-
公开(公告)号:CN117649610B
公开(公告)日:2024-05-28
申请号:CN202410122712.4
申请日:2024-01-30
Applicant: 江西农业大学
IPC: G06V20/10 , G06V20/40 , G06V10/44 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于YOLOv5的害虫检测方法及系统,该方法包括:从摄像头采集的视频画面中截取图像,输入到改进的YOLOv5检测模型进行害虫检测,获取害虫的类别和数量信息,所述改进的YOLOv5检测模型,以YOLOv5s为基础模型,将主干网络和颈部网络中的C3模块替换成C3NCBAM模块,所述C3NCBAM模块由C3模块中添加NCBAM模块构成,所述NCBAM模块由改进坐标注意力模块和空间注意力模块串联构成。本发明将YOLOv5s中的C3模块替换成C3CBAM模块,以提高模型的特征提取能力、检测的准确性和速度。
-
公开(公告)号:CN116912367B
公开(公告)日:2023-12-19
申请号:CN202311127041.2
申请日:2023-09-04
Applicant: 江西农业大学
IPC: G06T11/60 , G06T9/00 , G06T3/40 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明属于图像信息处理技术领域,公开了一种基于轻量级动态细化的文本生成图像方法及系统。本发明通过文本编码器将输入的文本编码为文本特征,由文本编码器编码的文本特征和由高斯分布采样的噪声向量输入生成器;噪声向量首先被馈送到一个全连接层再进行重塑,得到初始图像特征,通过多个动态文本图像融合细化块将文本特征融入初始图像特征进而得到精炼图像特征;最后,通过卷积层和激活层将精炼图像特征转换为生成图像。本发明可以更好地实现文本生成图像的自适应、细化、融合等过程,从而增强生成图像的真实感和表现力。
-
公开(公告)号:CN116503517B
公开(公告)日:2023-09-05
申请号:CN202310764770.2
申请日:2023-06-27
Applicant: 江西农业大学
IPC: G06T11/60 , G06T17/00 , G06T5/50 , G06F40/126 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F18/22 , G06V10/74 , G06V10/82
Abstract: 本发明提供了一种长文本生成图像的方法及系统,该方法包括:在潜在空间中随机获取一特征向量,并将所述特征向量输入至预设全连接层中,以生成对应的初始特征图;通过预设融合块和预设融合器将预设长文本特征对应融合至所述初始特征图中,以生成对应的中间特征图;依次通过预设卷积层和预设激活层对所述中间特征图进行图像化处理,以生成对应的目标图像,所述目标图像包含所述预设长文本特征中的特征元素。通过上述方式能够将外界的长文本特征对应融合至随机生成的初始特征图中,并最终根据该初始特征图生成需要的目标图像,并且该目标图像包含与上述长文本特征对应的特征元素,即对应的场景图像。
-
公开(公告)号:CN119152149B
公开(公告)日:2025-04-22
申请号:CN202411645849.4
申请日:2024-11-18
Applicant: 江西农业大学
IPC: G06T17/20 , G06V40/20 , G06V10/30 , G06V10/82 , G06N3/0464
Abstract: 本发明属于人体姿态识别技术领域,公开了基于扩散模型的多模态三维手部网格重建方法,通过特征提取模型采集深度图和点云数据,并根据深度图和点云数据提取手部关节特征;将一个初始化的标准高斯分布的噪声连同提取到的手部关节特征一起输入扩散模型中进行迭代去噪,通过多次迭代逐步从噪声中恢复出手部关节位置;根据手部关节位置,通过网格重建模块重建三维手部网格。本发明基于彩色图像,通过融合深度图和三维点云数据,实现了高精度的三维手部网格重建,显著提升了手部姿态重建的速度和准确性。
-
公开(公告)号:CN118247851A
公开(公告)日:2024-06-25
申请号:CN202410671058.2
申请日:2024-05-28
Applicant: 江西农业大学
IPC: G06V40/20 , G06V10/44 , G06N3/042 , G06N3/0464 , G06F3/01
Abstract: 本发明属于三维姿态估计技术领域,公开了一种端到端的手部对象交互姿态估计方法及系统,该方法包括特征提取阶段和重建阶段,所述特征提取阶段利用关键点检测模型提取特征和热图;所述重建阶段包括姿势重建分支和形状重建分支,所述姿势重建分支重建在交互场景下的手部和对象的姿态,所述形状重建分支重建在交互场景下的手部和对象的形状。本发明采用改进GraFormer模块对姿势重建分支和形状重建分支进行改进,改进GraFormer模块中加入了语义图卷积层,通过语义图卷积层对相邻节点之间的语义信息进行提取,增强特征的语义表达能力;在形状重建分支中加入了一个特征增强模块,提高了特征的表征能力。
-
公开(公告)号:CN118172648A
公开(公告)日:2024-06-11
申请号:CN202410591602.2
申请日:2024-05-14
Applicant: 江西农业大学
IPC: G06V10/82 , G06V10/44 , G06N3/0464 , G06N3/08
Abstract: 本发明属于图像识别技术领域,公开了一种基于双向曲形状态空间模型的手网格重建系统及方法,该手网格重建系统,包括编码器和解码器,所述编码器包括若干个双向曲形状态空间模型构成的第一编码阶段、第二编码阶段、第三编码阶段、第四编码阶段;所述解码器包括以若干个双向曲形状态空间模型构成的第一解码阶段、第二解码阶段、第三解码阶段、第四解码阶段;所述双向曲形状态空间模型包括特征重构、远程依赖学习及特征复原。本发明基于双向曲形状态空间模型和残差连接构建了一个浅、深层特征充分融合的U型架构,重建手网格的特征既具备较强的远程依赖,又富含细节信息。
-
-
-
-
-
-
-
-
-