-
公开(公告)号:CN114842307A
公开(公告)日:2022-08-02
申请号:CN202210776862.8
申请日:2022-07-04
Applicant: 中国科学院自动化研究所
IPC: G06V10/774 , G06V10/778
Abstract: 本发明提供一种掩码图像模型训练方法、掩码图像内容预测方法和设备,涉及图像处理技术领域,解决了预测的掩码图像内容准确度较低的问题。训练方法包括:将多个图像样本对应的可视化图像块输入至初始掩码图像模型中的非对称结构的初始编码模型中,得到各可视化图像块对应的编码特征对,并将各可视化图像块对应的编码特征对和第二数量个预设掩码补丁输入至初始掩码图像模型中的初始解码模型中,得到各掩码图像块对应的解码结果对;再根据多个图像样本各自对应的第二数量个掩码图像块和解码结果对,对初始编码模型和初始解码模型的模型参数进行更新,训练得到的掩码图像模型可以准确地预测掩码图像块的图像内容,提高了预测结果的准确度。
-
公开(公告)号:CN114333040B
公开(公告)日:2022-07-12
申请号:CN202210218277.6
申请日:2022-03-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种多层级目标检测方法及系统,包括:获取待检测目标图片集合;将所述待检测目标图片集合输入预先训练好的多层级目标检测模型中,得到初始目标检测结果和多个子目标检测结果;其中,所述多层级目标检测模型是获取目标检测数据集,基于单阶段初始目标检测网络训练参数确定多阶段子任务训练参数,对所述多阶段子任务训练参数进行更新,并对所述目标检测数据集的正负样本进行回归训练所获得的。本发明基于充分训练的目标检测神经网络,仅增加少量的参数量进行微调,即可完成已检测目标的二次分析,在保持该方法优势的同时,节约了计算量和部署工作量,同时在二次分析时可以引入上下文信息,获得更高的精度。
-
公开(公告)号:CN113408508A
公开(公告)日:2021-09-17
申请号:CN202110960664.2
申请日:2021-08-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明机器视觉、数据识别领域,具体涉及了一种基于Transformer的非接触式心率测量方法、系统及设备,旨在解决现有的对人脸心率测试中测量结果精度低、计算成本高的问题。本发明包括:获取设定时间段内包含人脸信息的待测视频帧序列;基于所述待测视频帧序列,通过人脸关键点模型获取人脸感兴趣区域图像序列;对所述人脸感兴趣区域图像序列进行预处理,并基于预处理后的所述人脸感兴趣区域图像序列,通过训练好的端到端Transformer模型获取设定时间段内的心率序列。本发明提高现有技术中对人脸心率测试的测量结果的精度,并降低计算成本。
-
公开(公告)号:CN112990152A
公开(公告)日:2021-06-18
申请号:CN202110504848.8
申请日:2021-05-10
Applicant: 中国科学院自动化研究所 , 公安部交通管理科学研究所
Abstract: 本发明属于计算机视觉和模式识别领域,具体涉及一种基于关键点检测和局部特征对齐的车辆重识别方法,旨在解决现有的车辆重识别方法在消除车辆视角变化时特征一致性较差,进而导致车辆重识别鲁棒性较差的问题。本方法包括获取待识别的车辆图像,作为输入图像;对输入图像进行关键点检测,获取待识别的车辆的关键点及其对应的置信度,并将输入图像中待识别的车辆划分为N部分,作为局部图像;提取输入图像、各局部图像的特征,作为全局特征、局部特征,并将各局部特征与全局特征进行拼接,作为综合特征;计算综合特征与车辆图像库中各图像对应特征的距离并进行排序,将排序结果作为重识别结果进行输出。本发明提高了车辆重识别的鲁棒性。
-
公开(公告)号:CN109785385B
公开(公告)日:2021-01-29
申请号:CN201910058977.1
申请日:2019-01-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种视觉目标跟踪方法及系统,所述视觉目标跟踪方法包括:获取多个历史目标模板及待跟踪目标的当前视频序列的历史位置信息;根据各所述历史目标模板,从所述待跟踪目标的当前视频序列中确定多组目标模板图像及搜索区域;根据目标定位模型,及每组目标模板图像及搜索区域,预测所述目标模板图像在搜索区域中的预测位置信息;基于动作网络模型,根据所述目标模板图像的预测位置信息及所述历史位置信息,确定所述目标模板图像的目标位置预测收益值;比较各个目标模板图像的目标位置预测收益值,确定目标位置预测收益值最大的目标模板图像的预测位置信息,从而能够精准确定待跟踪目标的当前帧图像的预测位置信息。
-
公开(公告)号:CN111739115A
公开(公告)日:2020-10-02
申请号:CN202010583710.7
申请日:2020-06-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于领域,具体涉及了一种基于循环一致性的无监督人体姿态迁移方法,旨在解决现有的姿态迁移方法在跨身份人体姿态迁移任务中适应性差、生成图像质量较低的问题。本发明包括:获取一个人体图像和另一目标姿态并根据人体图象和目标姿态通过基于循环一致性的无监督对抗网络生成姿态迁移图像,所述基于循环一致性的无监督对抗网络通过无身份标签的训练图像以及设定的全局损失函数进行迭代训练。本发明提高了跨身份人体姿态迁移任务的适应性,提高了生成图像的质量。
-
公开(公告)号:CN109785385A
公开(公告)日:2019-05-21
申请号:CN201910058977.1
申请日:2019-01-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种视觉目标跟踪方法及系统,所述视觉目标跟踪方法包括:获取多个历史目标模板及待跟踪目标的当前视频序列的历史位置信息;根据各所述历史目标模板,从所述待跟踪目标的当前视频序列中确定多组目标模板图像及搜索区域;根据目标定位模型,及每组目标模板图像及搜索区域,预测所述目标模板图像在搜索区域中的预测位置信息;基于动作网络模型,根据所述目标模板图像的预测位置信息及所述历史位置信息,确定所述目标模板图像的目标位置预测收益值;比较各个目标模板图像的目标位置预测收益值,确定目标位置预测收益值最大的目标模板图像的预测位置信息,从而能够精准确定待跟踪目标的当前帧图像的预测位置信息。
-
公开(公告)号:CN102054170B
公开(公告)日:2013-07-31
申请号:CN201110021981.4
申请日:2011-01-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明是基于极小化上界误差的视觉跟踪方法,利用跟踪器估计目标在当前帧中的区域,所述目标区域包括目标位置与目标大小;以估计的目标区域为参照提取样本;对提取的样本抽取两类不同性质的视觉特征;利用抽取的各样本两类不同性质的视觉特征在线进行协同提升学习,并对跟踪器进行更新,在线协同提升学习中,利用两个并行的提升算法同时对两类不同性质的视觉特征进行选择,并在各级视觉特征选择中利用协同学习进行相互约束,在选择最佳的视觉特征提升跟踪器性能的同时利用协同学习配置最佳的样本属性。跟踪器在线学习不需要输入样本的标注信息,在跟踪结果不完全准确的情况下也不会带来累计误差,从而保证了跟踪器的稳定性与可靠性。
-
公开(公告)号:CN102289817B
公开(公告)日:2013-04-17
申请号:CN201110201983.1
申请日:2011-07-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于群组上下文的行人计数方法,所述方法是根据固定监控摄像头采集的图像序列,提取运动前景图像;对相邻图像帧中的群组,建立群组距离矩阵;利用群组距离矩阵,建立群组相关性矩阵;利用群组相关性矩阵检测群组状态,并在图像序列中跟踪群组,以及识别群组事件中的群组关系,从而从群组出现到群组消失该时间段内建立群组上下文;利用内部群组上下文和外部群组上下文组建上下文掩模;根据上下文掩模构建最大联合后验概率估计问题,把基于单帧图像的行人计数问题推广到基于多帧图像上,用于统计监控场景中基于群组的行人人数。该方法有效降低遮挡、图像深度以及姿态变化给行人计数带来的误差,计数结果在时间域上具有一致性。
-
公开(公告)号:CN102256065B
公开(公告)日:2012-12-12
申请号:CN201110208090.X
申请日:2011-07-25
Applicant: 中国科学院自动化研究所
Abstract: 一种基于视频监控网络的视频自动浓缩方法,其是从两个具有重叠区域的摄像机获得第一视频源和第二视频源并对运动目标分割和跟踪,提取背景图像和视频监控网络运动轨迹;根据背景图像生成基于视频监控网络的全景图像,得到两个摄像机各自对应于全景图像的投影矩阵并实时更新基于视频监控网络背景的全景图像;利用两个摄像机全景图像的投影矩阵,把轨迹投影到全景图像空间得到投影轨迹;:采用图匹配,基于随机游走思想对两个摄像机的视频源的投影轨迹匹配,得到匹配轨迹对,对重叠区域的匹配轨迹进行选择和融合,得到完整的大场景轨迹;对大场景轨迹按时间重新排列,在全景图像上对完整的大场景轨迹进行展现,得到基于全景图像的视频浓缩。
-
-
-
-
-
-
-
-
-