一种基于非线性框架字典学习的超表面定位方法及装置

    公开(公告)号:CN117347946B

    公开(公告)日:2025-05-02

    申请号:CN202311062990.7

    申请日:2023-08-22

    Abstract: 本发明涉及一种基于非线性框架字典学习的超表面定位方法及装置,旨在解决现有技术中存在的稀疏表示及字典学习问题是基于线性建模,而定位问题用线性建模不能最高效的拟合,导致定位精度的下降的技术问题。本发明包括:获取带有标签矩阵的目标区域内的训练目标的定位数据;结合标签矩阵方法和字典学习方法构建字典学习模型和目标分类模型,并基于所述字典学习模型和所述目标分类模型的结合加入非线性函数,计算出所述定位数据的判别字典和目标区域内的分类参数;基于所述判别字典,运用稀疏编码方法获取待定位目标的稀疏系数;基于所述稀疏系数,结合所述分类参数,得到待定位目标的位置信息。

    基于解析稀疏表示的关键帧提取方法

    公开(公告)号:CN114220059B

    公开(公告)日:2024-10-29

    申请号:CN202111548537.8

    申请日:2021-12-17

    Abstract: 本发明公开了一种基于解析稀疏表示的关键帧提取方法,包括步骤:将视频转化为矩阵表示,视频矩阵的每一列为视频的每一帧信号;设计一个基于minimax concave penalty (MCP)稀疏正则化的解析稀疏编码模型;将视频矩阵作为原信号,视频矩阵的转置矩阵作为解析字典,带入解析稀疏编码模型;通过解析稀疏编码算法计算出稀疏系数矩阵,其中稀疏系数矩阵的非零行代表关键帧的索引;根据关键帧的索引选择出对应的该视频关键帧。本发明将提高选取关键帧的压缩率,同时降低计算复杂度,提高关键帧的提取速度。此外,本发明通过对许多具有挑战性的现实世界场景进行验证,相较于传统的关键帧提取方法具有更高的提取效率。

    基于标记稀疏的视频动作识别方法

    公开(公告)号:CN116863536A

    公开(公告)日:2023-10-10

    申请号:CN202310815490.X

    申请日:2023-07-04

    Inventor: 赵彬 滕寿淦 杨婷

    Abstract: 本发明公开了一种基于标记稀疏的视频动作识别方法。包括步骤:给定一个输入标记的序列,采用线性层为每个标记生成一个重要性分数;使用Gumbel‑Softmax从得分网络的输出中抽样;设计一种掩码策略来消除被丢弃的标记的影响;对于修剪后的标记,采用线性投影来保持标记数不变,在推理过程中,根据预测模块产生的概率将标记分为两组,使用自注意和线性投影来处理这两组标记,以保持特征结构;在前馈网络中引入非对称计算,保持混合子层的输入结构不变。本发明提出一个更通用的动态稀疏化框架的Transformer,它可以端到端训练,大量的实验证明了新框架在分层视觉Transformer架构上的有效性,此外,本发明在运行时动态地引入了空间稀疏性,降低了推理过程中的计算成本。

    基于深度学习的多人交互式手势识别系统

    公开(公告)号:CN116088690A

    公开(公告)日:2023-05-09

    申请号:CN202310152842.8

    申请日:2023-02-22

    Abstract: 本发明公开了一种基于深度学习的多人交互式手势识别系统。包括步骤:摄像头采集用户手势控制图像,启动一个新线程运行手势识别,将获取到的识别结果传到用户界面;Mediapipe采用机器学习管道对上个步骤中采集到的用户手势控制图像推断手的3D界标,在由手掌检测器定义的裁剪图像区域上运行并返回高保真3D手部关键点;用逻辑用语通过步骤2中高保真3D手部关键点判断手的数量及左右,继而用二维矩阵储存坐标信息,从而获取指关节坐标的时间序列及预处理;GRU网络结构将步骤3中指关节坐标转换为语义信息,经由分类网络加工处理;手势输出最终在服务端实现交互,信息在界面显示。本发明有效利用手掌动作的姿势信息,大大提高了手势识别的准确性。

    基于解析稀疏表示的关键帧提取方法

    公开(公告)号:CN114220059A

    公开(公告)日:2022-03-22

    申请号:CN202111548537.8

    申请日:2021-12-17

    Abstract: 本发明公开了一种基于解析稀疏表示的关键帧提取方法,包括步骤:将视频转化为矩阵表示,视频矩阵的每一列为视频的每一帧信号;设计一个基于minimax concave penalty(MCP)稀疏正则化的解析稀疏编码模型;将视频矩阵作为原信号,视频矩阵的转置矩阵作为解析字典,带入解析稀疏编码模型;通过解析稀疏编码算法计算出稀疏系数矩阵,其中稀疏系数矩阵的非零行代表关键帧的索引;根据关键帧的索引选择出对应的该视频关键帧。本发明将提高选取关键帧的压缩率,同时降低计算复杂度,提高关键帧的提取速度。此外,本发明通过对许多具有挑战性的现实世界场景进行验证,相较于传统的关键帧提取方法具有更高的提取效率。

    基于MCP稀疏表示字典学习模型的显著性检测方法

    公开(公告)号:CN114220058A

    公开(公告)日:2022-03-22

    申请号:CN202111548488.8

    申请日:2021-12-17

    Abstract: 本发明公开了一种基于MCP稀疏表示字典学习模型的显著性检测方法。包括提取图像或视频的超像素特征;基于minimax concave penalty(MCP)稀疏约束设计稀疏表示字典学习模型;使用稀疏表示字典学习模型通过重构误差来学习图像显著性区域,重构误差大的超像素位置被认为是显著性区域;采用基于上下文的方案来获得像素级的统一重构误差。通过利用多尺度重建误差和面向对象的高斯细化过程获取像素级别的显著性检测图;采用贝叶斯积分方法来合并从重构误差中学习到的显著性检测图,得到最终显著性检测结果。本发明将提高图像或视频的显著性检测水平。此外,本发明通过对现实图像和视频信号进行显著性检测验证,相较于传统的显著性检测方法具有更好的效果。

    基于知识蒸馏的半监督医学图像分割方法

    公开(公告)号:CN119130978A

    公开(公告)日:2024-12-13

    申请号:CN202411249023.6

    申请日:2024-09-06

    Inventor: 赵彬 王一凡

    Abstract: 本发明公开了一种基于知识蒸馏的半监督医学图像分割方法。包括步骤:设计一个Self‑Training训练框架,在编码器到解码器之间添加不同程度的特征扰动;在Self‑Training训练框架的解码器之间施加教师助理用于自身模型参数训练;在模型训练过程中引入确定知识转移机制用于半监督学习过程;使用高效多解码策略完成模型训练过程。本发明有效利用了无标记的数据样本,在2个基准数据集上的实验结果表明,与之前的最好结果相比,有显著性能提升。

    基于时间和运动增强的视频动作识别方法

    公开(公告)号:CN115565100A

    公开(公告)日:2023-01-03

    申请号:CN202211091323.7

    申请日:2022-09-07

    Abstract: 本发明公开了一种基于时间和运动增强的视频动作识别方法。包括步骤:设计一个多路径时间增强模块,聚合由各种激发模块激发的多路径时间信息;设计一个长短程运动增强模块,编码相邻和非相邻视频帧之间的运动特征;将多路径时间增强模块和长短程运动增强模块依次连接在一起,形成时间和运动增强模块,并将其嵌入到一个二维卷积神经网络中;在动作识别的数据集上进行参数学习,将输入的视频进行稀疏采样并获得8帧图像,然后对它们进行预处理后导入上述步骤得到的网络进行训练;在动作识别的数据集上对上述步骤得到的算法进行评估,并输出对应的测试结果。本发明有效利用了时间特征和运动信息,大大提高了动作识别的准确性和实时性。

    基于MCP稀疏表示字典学习模型的显著性检测方法

    公开(公告)号:CN114220058B

    公开(公告)日:2024-10-22

    申请号:CN202111548488.8

    申请日:2021-12-17

    Abstract: 本发明公开了一种基于MCP稀疏表示字典学习模型的显著性检测方法。包括提取图像或视频的超像素特征;基于minimax concave penalty(MCP)稀疏约束设计稀疏表示字典学习模型;使用稀疏表示字典学习模型通过重构误差来学习图像显著性区域,重构误差大的超像素位置被认为是显著性区域;采用基于上下文的方案来获得像素级的统一重构误差。通过利用多尺度重建误差和面向对象的高斯细化过程获取像素级别的显著性检测图;采用贝叶斯积分方法来合并从重构误差中学习到的显著性检测图,得到最终显著性检测结果。本发明将提高图像或视频的显著性检测水平。此外,本发明通过对现实图像和视频信号进行显著性检测验证,相较于传统的显著性检测方法具有更好的效果。

    基于一致性学习的左心房图像分割方法

    公开(公告)号:CN116958544A

    公开(公告)日:2023-10-27

    申请号:CN202310811345.4

    申请日:2023-07-04

    Abstract: 本发明公开了一种基于互惠一致性学习的左心房图像分割方法。包括步骤:设计一个由一个共享编码器和三个独立解码器构成的分割网络;由部分有标记的数据样本初始化上述步骤的分割网络;编码器提取到各级隐藏层特征后经特别设计的多级复合扰动后分别传输给不同解码器,经过多个上采样层和特征融合后这些解码器将输出三个具有差异的分割结果;评估这些结果的差异以计算认知不确定性数值,通过实行一致性正则化来降低不确定性值,进行模型训练;在测试数据集上对该网络进行评估,并输出对应的测试结果。本发明有效利用了无标记的数据样本,大大降低训练成本,提高了模型的分割精度。

Patent Agency Ranking