一种基于长时程深度时空网络的行为识别方法

    公开(公告)号:CN108319905A

    公开(公告)日:2018-07-24

    申请号:CN201810071442.3

    申请日:2018-01-25

    Abstract: 一种基于长时程深度时空网络的行为识别方法,包括如下步骤:构建多通道特征拼接网络模型;选取视频行为数据集,提取视频行为数据集中每个视频的彩色图像序列数据集和光流图像序列数据集;将彩色图像序列数据集和光流图像序列数据集按照连续多帧分为若干片段,片段输入多通道特征拼接网络模型,先经过低层提取每个片段连续帧的时空特征,再由中层拼接生成每个视频片段的整体时空特征,并将每个视频片段的整体时空特征按片段顺序串接形成视频的整体时空特征,然后在高层融合视频的整体时空特征,最后通过softmax层输出该视频行为的分类结果。本发明通过提取长时程多帧图像序列中的时空特征来识别视频中的复杂行为,提高了视频复杂行为的识别率和鲁棒性。

    基于SIP实现集群网关动态创建通道和扩容的系统和方法

    公开(公告)号:CN104702602B

    公开(公告)日:2018-01-02

    申请号:CN201510095630.6

    申请日:2015-03-04

    Abstract: 本发明公开了基于SIP实现集群网关动态创建通道和扩容的系统和方法,该方法包括集群网关管理端登录连接SIP服务器的过程,以及通过SIP服务器,与调度终端通过SIP协议进行数据交互,实现集群网关动态创建通道和扩容等过程,克服了现有集群网关在创建通道时,需要预先静态配置通道所对应的号码,集群网关不能够方便地实现动态创建通道和扩容等问题。与现有的集群网关比较,本发明提出的方法具有很大的灵活性,避免了为集群网关另外创建管理或数据通信通道带来的麻烦,具有很强的实用价值。

    一种高精度多角度人脸性别识别方法

    公开(公告)号:CN104933406A

    公开(公告)日:2015-09-23

    申请号:CN201510280719.X

    申请日:2015-05-27

    CPC classification number: G06K9/00228 G06K9/00288

    Abstract: 本发明提出了一种高精度多角度人脸性别识别方法。所述方法包含生成男女人脸性别字典和新输入人脸图片性别识别两个步骤;第一步,采集不同角度的男女人脸图片并归类,得到训练图片集并标准化,得到训练集,使用K-Means方法处理训练集,得到初级子字典,使用K-SVD方法改良初级子字典,并按性别合并,分别得到男女人脸性别字典;第二步,对新输入人脸图片进行与训练图片一样的标准化处理,得到一个测试向量,求出测试向量分别基于男女人脸性别字典的稀疏表示向量,分别求出两个稀疏表示向量的1范数,根据两个1范数值的大小来判断新输入人脸图片的性别。本发明方法对多角度人脸以及人脸存在一定噪声干扰和遮挡的情况下,有较高的性别识别准确率。

    一种城市视频监控系统的质量评价方法

    公开(公告)号:CN104780361A

    公开(公告)日:2015-07-15

    申请号:CN201510140343.2

    申请日:2015-03-27

    Abstract: 本发明公开了一种城市视频监控系统的质量评价方法,首先分别求得城市视频监控系统中的每一个监控摄像头的视频质量客观评价分数、有效监控区域评价分数和目标有效性检测评价分数,然后,在其基础上对其进行加权求和,得到单个监控摄像头的评价分数,最后,根据摄像头安装位置的重要程度对其设置权重,对所有摄像头的评价分数加权求和,得到城市视频监控系统的评价分数。本发明使得城市视频监控系统质量的评价不受人为因素的干扰,提高了系统质量评价的有效性和准确性,为现代城市智能监控系统的建设、评价与维护提供了依据。

    一种基于多摄像机的区域可疑目标跟踪与识别方法

    公开(公告)号:CN104008371A

    公开(公告)日:2014-08-27

    申请号:CN201410220523.7

    申请日:2014-05-22

    Abstract: 本发明提出了一种基于多摄像机的区域可疑目标跟踪与识别方法,解决小区域范围内单一可疑目标的准确识别与跟踪的问题。首先在多摄像机中的一个摄像机里确认要跟踪的目标,然后对该目标进行特征提取,同时判断出目标的位置和大小,然后将目标的特征信息进行更新。其他摄像机也同步运行,实时对目标进行检测,一旦接受到第一个摄像机发出的触发消息,则相应触发目标识别单元来识别要跟踪的目标,并将其更新,接着利用检测器和跟踪器完成对可疑目标的鲁棒跟踪,从而实现了多摄像机下的区域可疑目标跟踪与识别。所述方法的目标跟踪不仅在单摄像机情况下具有良好的鲁棒性,在多摄像机目标识别与跟踪时仍能保证较高的准确性,因此具有较好的应用前景。

    一种基于深信度网络的人车分类方法

    公开(公告)号:CN103778432A

    公开(公告)日:2014-05-07

    申请号:CN201410007538.5

    申请日:2014-01-08

    Abstract: 本发明提出了一种基于深信度网络的人车分类方法。所述方法将训练图像归一化为灰度图像,提取HOG算子,得到HOG特征直方图,将灰度图像拉直后与HOG特征直方图串联,训练DBN,构造基于DBN的人车分类网络;将待分类图像进行归一化和HOG特征提取后,输入基于DBN的人车分类网络中分类。本发明方法的深信度网络具有多个隐含层,拥有比浅层网络更加优异的特征表达能力;将原始图像和特征直方图相结合作为输入数据,在保留图像外观信息的基础上突出了局部梯度方向的统计信息;本发明对于光照、外观大幅变化的人车图像,仍可以获得优良的分类性能。

    一种基于互注意力融合和蒸馏机制的场景识别方法和系统

    公开(公告)号:CN117409268A

    公开(公告)日:2024-01-16

    申请号:CN202311290732.4

    申请日:2023-10-08

    Inventor: 孙宁 许伟 梁德志

    Abstract: 本发明公开了一种基于互注意力融合和蒸馏机制的场景识别方法和系统,适用于多模态场景,包括以下步骤:使用卷积神经网络对多模态场景数据集进行训练;将RGB图像和HHA图像进行序列化并添加位置编码,以得到RGB数据、HHA数据以及早期融合数据;构建端到端可训练的神经网络模型SAD,其中,SAD包括场景特征提取网络FEN、互补性特征融合模块CFB以及蒸馏模块;将未序列化的多模态场景数据集作为蒸馏模块输入,将此前得到的三种数据作为FEN输入,之后再通过CFB模块,并使用蒸馏模块指导整个网络的训练;图像经过序列化后得到相应数据,经过FEN提取多模态场景的特征后,再输入CFB模块得到该图像的场景类别。本发明的方法和系统提高了多模态场景识别的准确率。

    一种面向养老私密场景防虐的隐私保护ViT-iGAN视频行为检测方法

    公开(公告)号:CN117037037A

    公开(公告)日:2023-11-10

    申请号:CN202311033761.2

    申请日:2023-08-16

    Abstract: 本发明公开了一种面向养老私密场景防虐的隐私保护ViT‑iGAN视频行为检测方法,属于计算机视觉和行为识别领域,具体步骤为:通过多层压缩感知技术对监控视频进行降维编码处理,获取视觉隐私保护效果的视频数据;利用ViT视觉自注意力机制,对原始视频标记感兴趣的目标区域,用于网络建模;向改进生成对抗网络iGAN模型分别输入视隐态视频和前景标记视频,以迭代训练的形式实现视隐态视频数据的时空特征补偿;针对典型虐待行为,利用ViT‑iGAN分类网络对视隐态时空特征补偿数据进行行为检测。本发明能在确保视觉隐私有效保护的同时,对典型虐待老人行为保持较高的检测性能,兼顾隐私保护与智能监测,具有较佳的实际运用价值。

    一种基于自主航行技术的水下建筑物缺陷检测方法

    公开(公告)号:CN110989638A

    公开(公告)日:2020-04-10

    申请号:CN201911239047.2

    申请日:2019-12-06

    Abstract: 一种基于自主航行技术的水下建筑物缺陷检测方法,包括如下步骤,步骤S1、基于给定水域的二维地图信息,通过全覆盖路径规划遍历算法对待测水域进行全覆盖路径规划;步骤S2、通过定深控制系统、姿态控制系统、运动控制系统和短基线水声定位系统实现ROV在三维水下空间自主航行;步骤S3、通过超声波成像和水下摄像系统对水下建筑物进行缺陷检测与识别确定。该方法将自主航行技术与ROV结合,减轻远程手动操控的操控负担,同时,结合超声波成像与水下摄像技术,改善采集图像的清晰度,提高缺陷检测的准确度。

    多角度人脸表情图像的生成与识别方法

    公开(公告)号:CN110188656A

    公开(公告)日:2019-08-30

    申请号:CN201910445298.X

    申请日:2019-05-27

    Inventor: 孙宁 秦辉 李晓飞

    Abstract: 本发明公开了一种多角度人脸表情图像的生成与识别,将人脸局部关键特征与全局关键特征融合,并将对抗生成一致性网络CTGAN和卷积神经网络融合,形成了判别侧脸表情类别的深度神经网络,将四通道的侧脸图片送到生成器进行训练,而不是传统中将随机变量作为输入,从而最大化的保存了侧脸图片的特征信息,可以更有效的建立从侧脸到正脸图片的映射关系,提升整体识别准确率;将多种特征融合并使用卷积神经网络CNN对提取到的特征进行分类,能够极大的提升多角度人脸表情识别的准确率和鲁棒性。

Patent Agency Ranking