一种基于置信度分享的无标注场景自适应人体姿态和外形估计方法

    公开(公告)号:CN115880720A

    公开(公告)日:2023-03-31

    申请号:CN202211502587.7

    申请日:2022-11-28

    Abstract: 本发明公开一种自适应无标注场景的单目三维人体估计方法,以单目无标注的图像为输入估计人体的姿态和外形参数。首先,该方法同时以生成范式和回归范式两个学习视角识别目标人体。其中,回归范式的估计结果表现为一种三维人体网格,生成范式的估计结果表现为二维的人体轮廓分割和表面法线纹理贴图。随后,一个视角中置信度最高的估计结果会被筛选作为另一个视角的伪标,填充训练子集。特别的,本发明设计一个名为法线交并比损失的函数,监督法线贴图和三维网格的对齐。为保障在复杂的野外环境中训练的稳定性,本方法的回归范式估计结果由一种对遮挡鲁棒的自注意力回归器预测。综上,本发明所提出的人体估计方法,通过不断学习无标注数据集的分布特征,能有效提高实际部署场景下的人体估计精度,并且可以在复杂的遮蔽环境中稳定的部署。

    一种复杂表格及其内部手写数字识别方法

    公开(公告)号:CN106407883B

    公开(公告)日:2019-12-27

    申请号:CN201610649374.5

    申请日:2016-08-10

    Abstract: 本发明公开了一种复杂表格及其内部手写数字识别方法,首先对复杂表格模板进行预处理、直线检测、角点集的行列分类排序、模板表格定来实现对单元格的结构描述。在获得电子手写表格后,对其进行倾斜矫正并与模板表格适配,获得其单元格位置描述。随后,对每个单元格进行处理,去除边线的同时,尽可能完整地保留单元格内的字符。然后,提取单元格中数字图像,通过对数据集训练好的分类器,对数字图像进行识别。最后,对手写字符进行后处理,将识别结果填入模板表格中。本发明简单易实现,识别效果较好,为今后自动识别并录入表格提供了良好的解决方案。

    基于语义指导的视频行为检测方法

    公开(公告)号:CN114332723B

    公开(公告)日:2024-03-22

    申请号:CN202111669113.7

    申请日:2021-12-31

    Abstract: 本发明公开了基于语义指导的视频行为检测方法,通过特征的下采样来扩大时间感受野,并将线性插值用于上采样环节,从而得到视频时序上的粗略语义信息,用于指导时间卷积模型的输出;同时对模型的主干网络使用参数共享结构,将网络分为了三部分:生成粗略预测、细化和最终预测,以实现网络层数与参数量的最佳搭配;针对模型的时间建模能力,本发明提供了一种不需人工标注的视频速度预测的自监督辅助任务,可通过随机采样率的变换来模拟视频的播放速度,以辅助主干网络生成质量更高的预测。本发明主要针对以人为主体的视频,具有参数量低、精度高,方便对长视频进行操作等特点;对于无人的视频,本发明根据转场对视频进行分割。

    一种实时渲染中的水面仿真方法

    公开(公告)号:CN110163945B

    公开(公告)日:2022-11-29

    申请号:CN201910442598.2

    申请日:2019-05-25

    Abstract: 本发明涉及一种实时渲染中的水面仿真的方法,属于计算机图形学领域,旨在解决现有水面实时渲染仿真技术中无法兼顾真实感与计算效率的问题。本发明主要包含七个算法模块或部分,即:倒影摄像机、片元法线生成模块、水面反射颜色生成模块、水底颜色生成模块、菲涅尔系数生成方法、高光反射颜色生成方法、水面颜色混合方法。本发明通过上述算法模块或者部分的配合,可以得到最终的水面效果。本发明可应用于主流实时三维编程接口:OpenGL或DirectX。此外,本发明所采用的方法,在不涉及水体本身物理模拟,不涉及水面下观察的三维交互应用中,能够兼顾真实感与计算效率。

    基于代表性和特异性得分的非监督监控视频摘要生成方法及生成器

    公开(公告)号:CN113536035A

    公开(公告)日:2021-10-22

    申请号:CN202110463603.5

    申请日:2021-04-27

    Abstract: 本发明涉及一种基于代表性和特异性得分的非监督监控视频摘要生成方法及生成器。具体包括:针对监控视频,每隔一定的时间抽取帧,并使用卷积神经网络提取得到视频帧组的视觉特征组;使用图像直方图找到视频帧组断点以设置聚群数量,对视频帧组进行分类;利用聚类得到的视频帧组聚群,分聚群进行备选帧的筛选;计算每个聚群的所有备选帧的代表性得分;计算每个聚群的特异性得分;根据特异性得分高低舍弃一部分聚群,剩余聚群中按群分别将备选帧由高到低选择一部分备选帧做为选定帧,并按其在原始视频的时序进行排列生成视频摘要。

    复杂条件下银行卡号识别方法

    公开(公告)号:CN110610174A

    公开(公告)日:2019-12-24

    申请号:CN201910643964.0

    申请日:2019-07-16

    Abstract: 本发明设计一种复杂条件下银行卡号识别方法,该方法是一种利用角点检测、卷积神经网络和生成式对抗网络,在复杂的环境下进行对图像中银行卡的卡片号码的识别系统。本系统利用大量的复杂条件样本训练卷积神经网络,使得图片在角点检测后经过位置及角度校正后,无需其他的图片预处理方法,便能够在更为复杂的拍摄环境和成像环境的条件下检测出银行卡号码。对于低可读性的银行卡号码,本系统利用大量的复杂样本训练好的生成对抗网络DCGAN对其卡号图像进行增强,然后再利用训练好的卷积神经网络进行检测。

    一种基于遥感图像的旋转目标检测方法

    公开(公告)号:CN120014436A

    公开(公告)日:2025-05-16

    申请号:CN202411991662.X

    申请日:2024-12-31

    Abstract: 本发明公开了一种基于遥感图像的旋转目标检测方法,属于计算机视觉领域。首先,利用由目标姿态引导特征提取模块所组成的特征提取主干,提取RGB遥感图像的细粒度特征,得到一系列在空间分辨率和通道数上各不相同的特征图序列;随后,选取这些特征图序列的后三层特征,通过增强路径特征金字塔网络对特征的上下文信息进行聚合,并弥补在聚合过程中自下而上路径中的特征损失;最后,特征细化模块通过引入注意力机制,对拼接后的特征进行加权重构与优化,得到聚合后的多尺度细粒度特征,并将聚合后的多尺度细粒度特征送入分类头和回归头中,得到最终的目标检测结果。本发明在主流遥感图像的旋转目标检测方法中达到了极具竞争力的精准度。

    一种基于图神经网络的密集事件描述方法

    公开(公告)号:CN113158735B

    公开(公告)日:2024-08-23

    申请号:CN202110075596.1

    申请日:2021-01-20

    Abstract: 本发明公开了一种基于图神经网络的密集事件描述方法,能够根据视频生成包含全部事件的时间及对应文字描述。该方法包括以下步骤:利用光流法、3D卷积网络和2D卷积网络分别对视频数据提取特征;对2D卷积网络提取的特征建立空间图,通过图卷积网络迭代后生成的特征与光流法、3D卷积特征拼接为长特征;采用锚边框对不同时间段的特征进行检测,划分为不同密集事件时间区域;采用非极大值抑制策略来消除重叠区域过多及分数较低的候选时间区域;对每个候选区域特征构建时间图,通过GAT更新每节点特征;将每个候选区域特征通过LSTM解码成对应文字输出。本发明结合空间信息和时序信息生成更精确的事件发生时间和对应的描述语言。

    一种基于高级语义信息特征编码的视频描述方法

    公开(公告)号:CN116091978A

    公开(公告)日:2023-05-09

    申请号:CN202310159288.6

    申请日:2023-02-24

    Abstract: 本发明提供一种基于高级语义信息特征编码的视频描述方法。该发明包括:通过人工智能网络预测输入视频序列中包含的多个独立事件,并输出各事件的起止时间以及相应文字描述;通过解耦地提取原生视频的空间与时序特征,摒弃传统骨干网络,保留更完整的语义信息;通过高级语义信息编码器以及特征融合模块提炼视频特征,对高级语义信息进行解码以获得视频描述特征,取得更好的描述效果;通过时间戳预测模块以及描述内容预测模块分别处理视频描述特征获得最终描述结果。本发明主要针对包含多个事件的视频,具有参数量低、精度高,方便对视频操作等特点;对于生成的描述信息,可根据应用场景实现分类、检索、辅助视听等任务。

    一种基于速度终点指导的自监督行人轨迹预测方法

    公开(公告)号:CN115937896A

    公开(公告)日:2023-04-07

    申请号:CN202211512613.4

    申请日:2022-11-28

    Abstract: 本发明公开了一种基于速度终点指导的自监督行人轨迹预测方法,能够根据行人及其邻居的历史轨迹,预测得到多条可能的未来轨迹。该方法包括以下步骤:利用图注意力网络和Transformer分别对过去和未来轨迹进行空间交互特征和时间特征提取;将得到的时空特征送入条件变分自编码器预测得到多个“粗糙”的终点和速度;通过聚类算法对多个“粗糙”的终点进行聚类,划分得到“细化”的终点;将过去的时空特征、“细化”的终点、速度送入解码器得到最终的多条预测轨迹。本发明充分考虑了行人轨迹的交互特征,使用双分支的特征提取网络分别提取时空特征,同时通过自监督任务在不增加额外标注的情况下预测得到了多个终点和速度,并用于指导最终的轨迹生成。更近一步,我们对预测得到的多个终点进行聚类,保留了多种潜在的可能的同时增加了轨迹多样性。

Patent Agency Ranking