一种基于动作粒度分组结构的体育视频动作识别方法

    公开(公告)号:CN116524596A

    公开(公告)日:2023-08-01

    申请号:CN202310507915.0

    申请日:2023-05-08

    Abstract: 本发明属于计算机视觉与视频动作识别领域,公开了一种基于动作粒度分组结构的体育视频动作识别方法,提出了一种基于动作粒度的层次化分组结构,设计了一种轻量级的多尺度时空建模与信息融合机制。步骤如下:视频抽帧,分段随机帧采样,视频帧预处理,选取骨干网络,在骨干网络中插入动作粒度分组模块实现多尺度时空特征聚合,使用全连接层和softmax层进行类别预测,使用交叉熵损失对动作类别进行训练,训练及验证。通过使用本发明可有效的提取多粒度动作信息,适用于包含多层次类别的体育视频动作识别,并显著提高体育视频动作识别的精度。本发明作为一种基于动作粒度分组结构的体育视频动作识别方法,可广泛应用于体育视频动作识别领域。

    一种基于异质图的药物-蛋白质靶向作用预测方法

    公开(公告)号:CN112382411A

    公开(公告)日:2021-02-19

    申请号:CN202011275141.6

    申请日:2020-11-13

    Abstract: 本发明公开一种基于异质图的药物‑蛋白质靶向作用预测方法,包括:S1.通过获取来自Drugbank、SIDER等数据库的药物,靶点以及疾病等信息,与已有的公开数据集进行匹配整合,构建药物和靶点相关的异质图,并通过RDKit计算和基于成对的Smith‑waterman得分获得药物化学结构信息和蛋白质序列信息。S2.结合节点表示与图级表示之间的互信息以及子结构表示与图级表示之间的互信息,从异构信息中学习精确的和可解释的特征嵌入,提出了一个端到端的多视图自动编码器模型完成链路预测的任务。本发明对于药物重定向具有有益的科学指导作用,有利于发现潜在的药物‑蛋白质靶点有效链接,加快旧药新用的节奏。

    一种基于多任务信息互补的三维体素手势姿态估计方法

    公开(公告)号:CN113095262A

    公开(公告)日:2021-07-09

    申请号:CN202110429625.X

    申请日:2021-04-21

    Abstract: 一种基于多任务信息互补的三维体素手势姿态估计方法,步骤为:训练一个参考点精炼网络,获取准确的参考点;训练一个估计网络,使用中已获得的图像的准确参考点和手部关节位置真实值进行监督训练:对估计网络输出的三维热图执行概率估计,确定每个关节点最大的似然相应位置,然后将其转换到真实的坐标系中获得手部关节点的真实3D坐标。本发明使用三维体素化的方式来处理输入与输出,一方面改善了传统方法表示深度图像造成的透视失真,以及回归学习的高度非线性等问题。另一方面则是实现了模型参数压缩,使得模型的收敛更加的迅速,便于训练。同时引入多任务信息互补的策略,这种符合手势物理特性的网络结构在提升估计精度的同时也更具有鲁棒性。

Patent Agency Ranking