一种端到端的局部视频行为语义预测方法

    公开(公告)号:CN116259074A

    公开(公告)日:2023-06-13

    申请号:CN202310079023.5

    申请日:2023-01-17

    Abstract: 本发明提出一种端到端的局部视频行为语义预测方法,包括,获取包含人体运动的视频;对视频中的片段采样x帧原始帧,对x帧原始帧的RGB差分信息进行下采样,通过2D卷积网络对下采样得到的RGB差分特征进行特征提取,获得局部运动特征,对局部运动特征进行上采样,获得最终的局部运动特征;将原始帧通过2D卷积网络得到局部空间特征,将最终的局部运动特征与局部空间特征融合得到融合特征;将融合特征与局部运动特征融合得到片段的时空特征;根据视频中所有片段的时空特征,得到历史全局尺度,根据历史全局尺度对视频进行动作类别预测。通过本发明提出的方法,实现了以端到端的方式预测局部视频中的人体行为语义。

    一种基于改进郊狼优化算法的特征选择方法

    公开(公告)号:CN112085147A

    公开(公告)日:2020-12-15

    申请号:CN202010975367.0

    申请日:2020-09-16

    Inventor: 张志成 尹建芹

    Abstract: 本发明公开了一种基于改进郊狼优化算法的特征选择方法,包括如下步骤:从数据集中获取待选择的特征;初始化郊狼种群,获得郊狼的社会条件;将郊狼的社会条件转化为二进制数据;计算适应度函数值;确定每个子群中的头狼;计算每个子群的文化倾向;更新每个子群中的所有郊狼;每个子群生成二进制新生郊狼;每个子群执行出生‑死亡机制;部分郊狼在子群之间迁移;更新所有郊狼的年龄;判断当前迭代次数是否达到预设的最大迭代次数;选择种群中社会条件最好的郊狼所对应的特征作为最优特征子集。本发明算法调节参数少、搜索效率高、特征选择准确、自适应能力强,在不需要过多的人为参数调整干预的条件下,仍能够快速地搜索到最佳特征组合。

    一种基于深度特征的无约束重复动作计数方法

    公开(公告)号:CN110598646A

    公开(公告)日:2019-12-20

    申请号:CN201910874723.7

    申请日:2019-09-16

    Abstract: 本发明公开了一种基于深度特征的无约束重复动作计数方法,其特征在于,具体步骤包括如下:构建BN-Inception网络,并进行深度特征提取;将提取的深度特征进行降维,得到降维后的周期图;利用傅里叶变换对所述周期图进行分段阈值滤波,得到光滑的频率图;根据滤波后的频率图进行计数。本发明提供了一种基于深度特征的无约束重复动作计数方法,为了捕获较鲁棒的运动特征并有效的避免相机移动的干扰,对捕获的视频提取RGB和光流图,在此基础上使用深度ConvNets进行特征提取,基于特征值寻找体现重复动作的运动规律,使用变周期的傅里叶变换来处理复杂场景的非静止的视频动态,获取明显的运动频率,更好的统计重复运动次数。

    一种基于池化Transformer的多任务全心脏CT分割方法

    公开(公告)号:CN117011306A

    公开(公告)日:2023-11-07

    申请号:CN202310609850.0

    申请日:2023-05-26

    Abstract: 本发明提出一种基于池化Transformer的多任务全心脏CT分割方法,包括,获取全心脏CT图像训练数据集;构建全心脏CT图像分割模型,其中全心脏CT图像分割模型包括3D transformer编码器和3D卷积神经网络解码器,采用3D池化注意力机制计算图像块与图像块之间的关系;将全心脏CT图像训练数据集输入全心脏CT图像分割模型进行训练,得到完成的全心脏CT图像分割模型;其中分割损失函数由Dice损失函数和加权交叉熵损失函数组成;将测试数据集中的图像输入训练完成的全心脏CT图像分割模型,获取图像分割结果。通过本发明提出的方法,可以准确高效的进行心脏分割。

    基于邻域聚合蒙特卡罗失活的点云语义不确定度感知方法

    公开(公告)号:CN114241110B

    公开(公告)日:2022-06-03

    申请号:CN202210165979.2

    申请日:2022-02-23

    Abstract: 本发明提出一种基于邻域聚合蒙特卡罗失活的点云语义不确定度感知方法,其中包括,获取待处理场景的原始点云;将原始点云作为输入,以PointNet(++)为基础模型构建NSA‑MC‑dropout框架,其中,在编码阶段,NSA‑MC‑dropout框架生成不同粒度的特征向量,在解码阶段,特征向量被拼接到对应空间点,运用带有空间采样的多层感知机进行推理后生成各个无序点的随机推理结果;通过对随机推理结果进行融合实现单次随机推理建立原始点云中各个无序点预测分布;通过捕获预测分布中包含的信息量来量化点云语义不确定度或通过建模所述预测分布的分散程度来量化点云语义不确定度。在不增加模型参数和推理次数的基础上,实现了不确定度感知点云语义分割的框架。

    基于邻域聚合蒙特卡罗失活的点云语义不确定度感知方法

    公开(公告)号:CN114241110A

    公开(公告)日:2022-03-25

    申请号:CN202210165979.2

    申请日:2022-02-23

    Abstract: 本发明提出一种基于邻域聚合蒙特卡罗失活的点云语义不确定度感知方法,其中包括,获取待处理场景的原始点云;将原始点云作为输入,以PointNet(++)为基础模型构建NSA‑MC‑dropout框架,其中,在编码阶段,NSA‑MC‑dropout框架生成不同粒度的特征向量,在解码阶段,特征向量被拼接到对应空间点,运用带有空间采样的多层感知机进行推理后生成各个无序点的随机推理结果;通过对随机推理结果进行融合实现单次随机推理建立原始点云中各个无序点预测分布;通过捕获预测分布中包含的信息量来量化点云语义不确定度或通过建模所述预测分布的分散程度来量化点云语义不确定度。在不增加模型参数和推理次数的基础上,实现了不确定度感知点云语义分割的框架。

    基于关系建模的人体姿态估计方法

    公开(公告)号:CN113807321A

    公开(公告)日:2021-12-17

    申请号:CN202111212014.6

    申请日:2021-10-18

    Abstract: 本发明公开了基于关系建模的人体姿态估计方法,包括以下步骤:步骤一:给定一段包含N帧的视频,即RPSTN采用连续的T帧作为输入,给定由P生成的初始姿态,本发明相比于已有方法,本文提出的RPSTN对遮挡问题具有一定的鲁棒性,一方面JRE模块可以通过学习到的姿态结构信息,即关节点之间的关系,在空间上推理被遮挡关节点的位置,另一方面,JRPSP模块可以将未遮挡帧中的姿态信息传递到被遮挡帧中以帮助定位姿态,且避免了在生成关节点热图的过程中,已有方法都是单个关节点逐点定位,而忽略了关节点之间的联系,人体是一个有机的整体,在运动过程中各个关节点是相互关联的,已有方法逐点定位的方式会破坏人体的结构信息的问题。

    一种基于多类别目标分割的机器人抓取检测方法

    公开(公告)号:CN112861667A

    公开(公告)日:2021-05-28

    申请号:CN202110102963.2

    申请日:2021-01-26

    Abstract: 本发明公开了一种基于图像分割技术的抓取检测方法,该方法使用图像分割技术,将目标物体从杂乱的场景中分割出来,对只含有目标信息的图像做抓取检测。通过这种方法消除了背景信息对抓取检测的干扰,使得抓取检测为面向对象的抓取检测而不是面向场景的抓取检测。同时通过此种方法提高了模型对不同环境的鲁棒性,减小了模型在抓取检测时对环境特征的依赖,提高了模型对不同背景下物体的检测能力。

Patent Agency Ranking