一种基于多尺度多粒度特征解耦的图像重构方法及系统

    公开(公告)号:CN114067162A

    公开(公告)日:2022-02-18

    申请号:CN202111401567.6

    申请日:2021-11-24

    Abstract: 本发明属于图像领域,具体涉及一种基于多尺度多粒度特征解耦的图像重构方法及系统,包括提供一种深度隐变量特征解耦生成模型,模型包括编码器、隐空间特征解耦、分类模型和重构模型四个模块,利用编码器对图像进行编码,得到包含多粒度语义信息的深度隐变量;分类模型根据解耦后的深度隐变量包含的粗粒度信息,对图像的所属类别进行细化;重构模型对解耦后的深度隐变量进行解码,得到重构生成图像;本发明利用多尺度多粒度语义标签将深度隐变量生成模型的隐空间有监督的解耦成不同层次的语义类别的子空间,更好地学习到图像中不同粒度层次的语义信息,从而能更好地应用于生成任务。

    一种迭代协作的视频超分辨率重构方法及系统

    公开(公告)号:CN113947531A

    公开(公告)日:2022-01-18

    申请号:CN202111272653.1

    申请日:2021-10-29

    Abstract: 本发明属于计算机视觉领域,具体涉及一种迭代协作的视频超分辨率重构方法及系统,该方法包括:输入低分辨率视频帧序列,提取其特征图;将提取的特征图分别输入对齐网络和分频重构网络,得到时间特征图和空间特征图;利用时空残差融合模块将时间特征图和空间特征图进行融合,得到时空特征图;将得到的时空特征图再次输入到对齐网络和分频重构网络中,将对齐网络与分频重构网络输出的结果输入时空残差模块进行融合;迭代数次直到得到无冗余的时空特征图;将低分辨率视频序列进行上采样后与无冗余的时空特征图相加得到高分辨率图;本发明引入迭代协作网络、分频重构网络和时空残差融合,达到了减小了对齐误差和提升视频超分辨率重构性能的目的。

    一种基于图像点云多模态融合与关节引导的手势重建方法

    公开(公告)号:CN119963740A

    公开(公告)日:2025-05-09

    申请号:CN202510125414.5

    申请日:2025-01-27

    Abstract: 本发明属于人机交互和计算机视觉领域,特别涉及一种基于图像点云多模态融合与关节引导的手势重建方法,包括以手部深度图与三维点云作为输入,利用针对二维深度图像和三维点云的特征提取网络分别提取深度图及三维点云的关键点特征;随后利用多模态特征与全局特征融合模块,为多模态特征提供额外的全局信息;接着,使用关节坐标引导的特征融合迭代模块进一步优化和更新融合特征,以提高三维手势的重建精度,同时通过多次迭代更新实现了对手部姿态中各关键点的精确估计。本发明有效结合了深度图像信息与点云空间几何结构特征,同时采用关键点特征来聚合各自模态的特征信息,减少了无效特征的冗余交互,并提高了多模态融合的效率。

    一种采样无关的全度量小样本目标检测方法

    公开(公告)号:CN115240008B

    公开(公告)日:2025-05-09

    申请号:CN202210931306.3

    申请日:2022-08-04

    Abstract: 本发明属于人工智能技术领域,具体涉及一种采样无关的全度量小样本目标检测方法,包括:构建全度量样本检测模型,并微调全度量样本检测模型;采样小样本数据,对小样本数据集进行组织划分,得到类支持集和查询集,并对类支持集中的类支持样本进行预处理;将小样本数据输入到微调后的全度量样本检测模型,进行目标检测并获得检测结果。本发明通过使用跨尺度语义匹配减少由于和尺度差异而导致匹配次优结果;通过构造一组正常和损坏图片对,采用自监督学习策略约束网络使编码器可利用上下文构建出更为鲁棒原型;为原型向量增设了空间位置信息来引导模型更为准确捕获到目标。

    一种迭代协作的视频超分辨率重构方法及系统

    公开(公告)号:CN113947531B

    公开(公告)日:2024-04-26

    申请号:CN202111272653.1

    申请日:2021-10-29

    Abstract: 本发明属于计算机视觉领域,具体涉及一种迭代协作的视频超分辨率重构方法及系统,该方法包括:输入低分辨率视频帧序列,提取其特征图;将提取的特征图分别输入对齐网络和分频重构网络,得到时间特征图和空间特征图;利用时空残差融合模块将时间特征图和空间特征图进行融合,得到时空特征图;将得到的时空特征图再次输入到对齐网络和分频重构网络中,将对齐网络与分频重构网络输出的结果输入时空残差模块进行融合;迭代数次直到得到无冗余的时空特征图;将低分辨率视频序列进行上采样后与无冗余的时空特征图相加得到高分辨率图;本发明引入迭代协作网络、分频重构网络和时空残差融合,达到了减小了对齐误差和提升视频超分辨率重构性能的目的。

    一种面向虚拟现实人机交互的空中手写识别方法

    公开(公告)号:CN117409423A

    公开(公告)日:2024-01-16

    申请号:CN202311325667.4

    申请日:2023-10-13

    Abstract: 本发明涉及人机交互、计算机视觉领域,尤其涉及一种面向虚拟现实人机交互的空中手写识别方法,包括利用虚拟现实设备捕捉用户在空中进行手写的轨迹序列,得到手写轨迹序列;将手写轨迹序列投影到同一个平面,对手写轨迹序列进行矫正;将矫正后的手写轨迹序列进行规范化处理,规范化处理包括进行归一化和重采样;从规范化处理后的手写轨迹序列中提取轨迹点横轴和纵轴的偏移量、轨迹书写方向的余弦和正弦值、轨迹书写曲率的余弦和正弦值;构建基于编码器和解码器结构的神经网络注意力模型,将提取的特征输入该模型进行识别,然后输出识别结果;本发明在保证较高的识别准确率的同时,显著提升了空中手写的识别速度。

    一种自适应神经网络预设跟踪性能控制方法、系统及介质

    公开(公告)号:CN117055340A

    公开(公告)日:2023-11-14

    申请号:CN202310842015.1

    申请日:2023-07-10

    Abstract: 本发明请求保护一种自适应神经网络预设跟踪性能控制方法、系统及介质,属于切换系统跟踪控制技术领域,本发明为了达到理想的跟踪控制性能并消除在反步法设计控制器的过程中产生的“计算爆炸”问题,通过利用命令滤波的方法,设计了一种基于命令滤波的自适应神经网络预设跟踪性能控制策略。所提出的控制方案消除了控制器设计过程中的“计算爆炸”问题、补偿了滤波误差,并放松了对参考信号的约束条件。该算法证明了闭环系统是半全局最终一致有界的,并且保证了跟踪误差始终限制在性能函数所限定的指定区域内。本发明结合实际问题,建立模型并求解模型获取结果,对于数学与工科问题的交叉研究提供了新思路和解决办法。

    一种基于图对比的无参考图像质量评价方法

    公开(公告)号:CN116468722A

    公开(公告)日:2023-07-21

    申请号:CN202310587482.4

    申请日:2023-05-23

    Abstract: 本发明涉及一种基于图对比的无参考图像质量评价方法,包括:将组合失真图像对输入图表征生成模型生成初始特征图;将初始特征图输入正负失真对比样本生成模型生成正例失真关系图结构和负例失真关系图结构;将正例失真关系图结构和负例失真关系图结构分别输入对比学习编码器模型得到正样本特征向量和负样本特征向量;计算对比损失函数;将正例失真关系图结构和负例失真关系图结构中的嵌入节点进行分离,将节点的特征信息分别输入失真类型预测模型计算预测损失函数;对对比损失函数和预测损失函数进行交替性优化,将节点的特征信息输入训练好的质量分数回归模型输出对应的质量评价分数。

    一种基于图形结构引导感知的跨模态手写文本识别方法

    公开(公告)号:CN118334682B

    公开(公告)日:2024-10-29

    申请号:CN202410462544.3

    申请日:2024-04-17

    Abstract: 本发明涉及人机交互、计算机视觉领域,特别涉及一种基于图形结构引导感知的跨模态手写文本识别方法,用户通过VR设备用手在空中书写英语单词,VR设备对其手势进行识别并对空中书写轨迹进行记录,对书写轨迹进行识别的过程包括:将采集的书写轨迹转换为基于骨架的几何图;构建基于时间卷积循环网络的轨迹编码器,利用该编码器从写轨迹中提取时空信息,得到书写轨迹的特征编码;构建基于金字塔图网络的图形编码器,利用该编码器从基于骨架的几何图中提取拓扑信息,得到几何图的特征编码;构建基于图形结构引导感知的跨模态解码器,将时空信息和拓扑信息作为多模态数据输入该解码器,该解码器识别得到字母序列;本发明在手写文本识别方面取得了较同时期的其他主流方法更为先进的性能。

    一种基于三维手势重建的空中手写交互方法、存储介质以及装置

    公开(公告)号:CN117058691A

    公开(公告)日:2023-11-14

    申请号:CN202310553707.4

    申请日:2023-05-16

    Abstract: 本发明属于人机交互和计算机视觉领域,特别涉及一种基于三维手势重建的空中手写交互方法,包括:获取用户空中手写交互的彩色图像数据流,并输入到深度神经网络中进行手部核心区域分割和手部关节点二维信息提取;将手部核心区域图和手部关节点二维信息输入到解码网络中估计三维空间中用户的手势模型,并对手势模型进行约束重建;根据重建后的三维手势模型实时获取用户的指尖运动轨迹,采用时序卷积循环神经网络对指尖运动轨迹进行识别,得到空中手写交互识别结果;本发明使用时序卷积循环网络来直接处理手写运动轨迹,不但能够识别输出手写文本行,而且还具备更高的识别精度、更小的计算开销和模型存储,提升了系统的实用性和普及性。

Patent Agency Ranking