一种目标图像处理模型的确定方法、装置及存储介质

    公开(公告)号:CN112580804B

    公开(公告)日:2024-04-05

    申请号:CN202011555461.7

    申请日:2020-12-23

    Abstract: 本发明涉及一种目标图像处理模型的确定方法、装置及存储介质,方法包括根据待剪枝图像处理模型的历史剪枝信息和历史精度信息,确定当前剪枝信息;基于当前剪枝信息,对待剪枝图像处理模型进行剪枝处理,得到剪枝后的模型;将样本图像输入剪枝后的模型,进行特征预测处理,得到预测特征信息;根据样本图像的标签信息和预测特征信息,确定剪枝后的模型的精度信息;根据剪枝后的模型的精度信息和当前剪枝信息,确定待剪枝信息;若待剪枝信息满足预设停止剪枝条件,将剪枝后的模型确定为目标图像处理模型。本发明可以减小目标图像处理模型的结构,减少目标图像处理模型所占资源,还可以保证剪枝后的网络模型的精度。

    双目相机自标定方法及系统

    公开(公告)号:CN111862234B

    公开(公告)日:2023-10-20

    申请号:CN202010711704.5

    申请日:2020-07-22

    Abstract: 本发明提供一种双目相机自标定方法及系统,包括:1)获取左右原始图像;2)校正左右原始图像;3)从左右校正图像中提取特征点并匹配;4)统计左右图像纵坐标偏差的平均值,若大于对应阈值则修正估计第一参数组,反复迭代修正,直至小于对应阈值;5)找到静态物体;6)处于移动状态时,追踪静态物体的视差及车轮运动信息;7)得到车轮运动距离与静态物体的三维距离变化值的距离偏差,若大于对应阈值则修正估计第二参数组,反复迭代校正,直至小于对应阈值,完成自标定。本发明利用实时图像追踪和车体运动信息,对内外参进行优化标定,完成图像校正工作,为车体提供准确的三维识别数据。

    一种移动机器人视听觉融合感知与导航方法

    公开(公告)号:CN116380061A

    公开(公告)日:2023-07-04

    申请号:CN202211614647.4

    申请日:2022-12-15

    Abstract: 本发明涉及一种移动机器人视听觉融合感知与导航方法,包括以下步骤:对移动机器人的视觉传感器系统与听觉传感器系统进行参数标定;利用视觉传感器系统和标定的参数构建导航栅格地图;使用视觉传感器系统获取交互对象的视频序列,并基于三维卷积和长短期记忆网络的手势识别方法,利用注意力机制和多尺度特征融合,实现以所述视频序列为输入的端到端手势行为识别;从所述视频序列中提取出感兴趣的目标对象并进行跟踪,并利用听觉传感器系统和视觉传感器系统得到具有显著性的目标对象的序列。本发明能够以更加智能和自然的方式与机器人导航系统进行交互。

    基于结构差异感知的类别级六自由度物体位姿估计方法

    公开(公告)号:CN116245940A

    公开(公告)日:2023-06-09

    申请号:CN202310052012.8

    申请日:2023-02-02

    Abstract: 本发明涉及一种基于结构差异感知的类别级六自由度物体位姿估计方法,包括:将深度图输入至目标检测分割网络进行识别,并根据识别结果得到物体实例的观测点云,并基于物体实例的观测点云选择目标物体对应的类别先验;提取观测点云和类别先验的特征,得到实例几何特征和类别几何特征;将实例几何特征和类别几何特征输入信息交互增强模块,得到增强的实例几何特征和类别几何特征;再通过所述语义动态融合模块进行语义和几何信息的融合,得到实例融合特征和类别融合特征;基于类别融合特征得到实例NOCS模型;通过匹配网络将实例NOCS模型和观测点云进行匹配,并根据相似性计算得到目标物体的6D位姿和大小。本发明能够提高6D位姿估计的准确性。

    一种结合语义边缘的深度估计方法

    公开(公告)号:CN114882091A

    公开(公告)日:2022-08-09

    申请号:CN202210476348.2

    申请日:2022-04-29

    Abstract: 本发明涉及一种结合语义边缘的深度估计方法,包括:获取待深度估计的图像;将所述图像输入至训练好的深度学习网络中得到深度预测图和语义边缘预测图;所述深度学习网络包括:共享特征提取模块、深度估计模块、边缘增强权重模块、深度边缘语义分类模块和语义边缘检测模块;所述共享特征提取模块用于提取所述图像中的特征信息,并传输给所述深度估计模块和语义边缘检测模块;所述深度估计模块通过所述语义边缘检测模块输出的语义边缘引导视差平滑,并通过图像双重构的方式进行深度估计;所述边缘增强权重模块基于所述深度估计模块输出的深度预测图的深度边缘形成所述语义边缘检测模块所需要融合的特征结果;所述深度边缘语义分类模块用于进行深度边缘语义分类预测;所述语义边缘检测模块用于输出图像的语义边缘分类预测。本发明能够提高准确度。

    一种身份信息的确定方法、装置、电子设备及存储介质

    公开(公告)号:CN113886791A

    公开(公告)日:2022-01-04

    申请号:CN202111219097.1

    申请日:2021-10-19

    Abstract: 本申请实施例所公开的一种身份信息的确定方法、装置、电子设备及存储介质,包括获取用户的待验证面部图像,若待验证面部图像与候选面部图像集合中的任一候选面部图像匹配,基于动态的目标生成第一图像序列;其中,第一图像序列中的每个第一图像包括目标,目标在每个第一图像中的位置是不同的。进而获取用户对应的第二图像序列,该第二图像序列中的每个第二图像是用户注视目标时采集的用户的面部图像,并根据第一图像序列和第二图像序列,确定用户的身份信息。基于本申请实施例通过基于动态的目标随机生成给用户注视的第一图像序列,可以有效防止他人利用静态图片、录制视频等手段欺骗认证系统,可以提高系统的安全性和可靠性。

    一种瞳孔中心位置数据的确定方法、装置及存储介质

    公开(公告)号:CN113729616A

    公开(公告)日:2021-12-03

    申请号:CN202111023640.0

    申请日:2021-09-01

    Abstract: 本申请实施例所公开的一种瞳孔中心位置数据的确定方法、装置及存储介质,包括获取眼球中心对应的眼球位置数据、瞳孔中心对应的瞳孔参考位置数据、第一瞳孔候选区域和第二瞳孔候选区域,从第一瞳孔候选区域中确定第一候选位置数据集合,从第二瞳孔候选区域中确定第二候选位置数据集合,基于眼球位置数据、瞳孔参考位置数据、第一候选位置数据集合和第二候选位置数据集合,确定瞳孔中心位置数据。本申请实施例基于双眼视线的内在关系从候选位置数据组集合中确定视线交汇的候选位置数据作为瞳孔中心位置数据,可以提升双眼视线估计精度。

    一种多路图像数据同步发送装置、接收装置和传输系统

    公开(公告)号:CN111698386B

    公开(公告)日:2021-07-09

    申请号:CN202010455596.X

    申请日:2020-05-26

    Abstract: 本发明涉及一种多路图像数据前端同步发送装置,包括:图像接入与合并传输模块,用于完成多路图像数据的同步接入与合并;图像帧编号添加模块,用于对合并后的图像数据依次添加图像帧编号;图像行/帧校验添加模块,用于对图像数据添加行/帧校验码;至少两条图像发送通道,用于完成多路图像的同步输出,其中,每条图像发送通道中传输的图像数据完全相同。本发明还涉及一种多路图像数据后端同步接收装置和一种多路图像数据的远距离同步传输系统。本发明对非压缩的多路图像数据能够提高同步传输可靠性。

    视线识别模型的训练方法、视线识别方法、装置及设备

    公开(公告)号:CN112766097A

    公开(公告)日:2021-05-07

    申请号:CN202110015600.5

    申请日:2021-01-06

    Abstract: 本发明涉及一种视线识别模型的训练方法、视线识别方法、装置及设备,方法包括获取样本图像集,样本图像集包括含有第一区域和第二区域的样本图像,将样本图像输入预设机器学习模型,进行视线识别处理,得到第一区域对应的第一视线信息以及第二区域对应的第二视线信息,基于第一视线信息,确定第二区域对应的第三视线信息,基于第二视线信息和第三视线信息,确定第一损失信息,根据第一损失信息,确定损失信息,基于损失信息调整预设机器学习模型中的模型参数,至损失信息满足预设条件,将满足预设条件时的预设机器学习模型作为视线识别模型。本发明可以在不增加视线识别模型规模的前提下,提高视线识别模型识别视线的精确性。

Patent Agency Ranking