-
公开(公告)号:CN113903028B
公开(公告)日:2024-10-29
申请号:CN202111045058.4
申请日:2021-09-07
Applicant: 武汉大学
IPC: G06V20/64 , G06N3/096 , G06N3/0464 , G06N3/045
Abstract: 本申请公开了一种目标检测方法及电子设备,涉及计算机视觉技术领域,该方法包括:定义锚框模板;构建目标检测神经网络并进行训练,利用训练好的目标检测神经网络提取输入图像中目标的锚点参数和目标类别;得到二维边界框、三维边界框以及三维边界框的中心位置坐标;将中心位置坐标按照编码的逆向计算反投影得到相机坐标;获取三维边界框投影后得到的投影二维框,并将投影二维框与二维边界框做L1loss函数,调整观察视角角度,直至观察视角角度的调整步长小于预设终止参数,得到调整后的三维边界框;输出目标的目标类别、二维边界框、相机坐标、以及调整后的三维边界框。本申请,有效排除了外界噪音干扰,提高单目图像三维目标的检测精度。
-
公开(公告)号:CN113903028A
公开(公告)日:2022-01-07
申请号:CN202111045058.4
申请日:2021-09-07
Applicant: 武汉大学
Abstract: 本申请公开了一种目标检测方法及电子设备,涉及计算机视觉技术领域,该方法包括:定义锚框模板;构建目标检测神经网络并进行训练,利用训练好的目标检测神经网络提取输入图像中目标的锚点参数和目标类别;得到二维边界框、三维边界框以及三维边界框的中心位置坐标;将中心位置坐标按照编码的逆向计算反投影得到相机坐标;获取三维边界框投影后得到的投影二维框,并将投影二维框与二维边界框做L1loss函数,调整观察视角角度,直至观察视角角度的调整步长小于预设终止参数,得到调整后的三维边界框;输出目标的目标类别、二维边界框、相机坐标、以及调整后的三维边界框。本申请,有效排除了外界噪音干扰,提高单目图像三维目标的检测精度。
-
公开(公告)号:CN113870309A
公开(公告)日:2021-12-31
申请号:CN202111111915.6
申请日:2021-09-23
Applicant: 武汉大学
Abstract: 为了解决行人轨迹预测中行人移动的随机性大、外部因素对行人行动影响大的问题,通过对行人目的地的内在因素的预测建模和对行人社会信息的池化处理,可以有效地提高预测轨迹的。本发明公开了一种基于目的地预测和社会变换器的行人轨迹预测方法,采用条件式变分自编码机进行目的地预测、社会变换器进行行人社会关系变换,根据行人行动的内部和外部的上下文线索对神经网络预测结果进行约束,从而获得更好的预测精度。
-
公开(公告)号:CN113869170B
公开(公告)日:2024-04-23
申请号:CN202111105740.8
申请日:2021-09-22
Applicant: 武汉大学
Abstract: 本发明涉及一种基于图划分卷积神经网络的行人轨迹预测方法,在自动驾驶中,为了解决轨迹预测核心问题,即如何设计模型更好地捕获关联交互信息来提升预测精度与自动驾驶汽车的安全性,本发明设计了一套应用于复杂场景下的行人轨迹的预测模型,基于图划分卷积神经网络GP‑CNN,使用了两条通道相结合的方式提取场景的交互特征作为输入,并针对行人轨迹的时域特性的信息的专门处理,同时通过残差连接使得预测轨迹的前后向传播更加平滑顺畅,再通过轨迹预测网络生成行人交互预测轨迹。
-
公开(公告)号:CN113870309B
公开(公告)日:2024-08-09
申请号:CN202111111915.6
申请日:2021-09-23
Applicant: 武汉大学
IPC: G06T7/246 , G06V20/56 , G06V10/82 , G06N3/0455 , G06N3/042
Abstract: 为了解决行人轨迹预测中行人移动的随机性大、外部因素对行人行动影响大的问题,通过对行人目的地的内在因素的预测建模和对行人社会信息的池化处理,可以有效地提高预测轨迹的。本发明公开了一种基于目的地预测和社会变换器的行人轨迹预测方法,采用条件式变分自编码机进行目的地预测、社会变换器进行行人社会关系变换,根据行人行动的内部和外部的上下文线索对神经网络预测结果进行约束,从而获得更好的预测精度。
-
公开(公告)号:CN113869170A
公开(公告)日:2021-12-31
申请号:CN202111105740.8
申请日:2021-09-22
Applicant: 武汉大学
Abstract: 本发明涉及一种基于图划分卷积神经网络的行人轨迹预测方法,在自动驾驶中,为了解决轨迹预测核心问题,即如何设计模型更好地捕获关联交互信息来提升预测精度与自动驾驶汽车的安全性,本发明设计了一套应用于复杂场景下的行人轨迹的预测模型,基于图划分卷积神经网络GP‑CNN,使用了两条通道相结合的方式提取场景的交互特征作为输入,并针对行人轨迹的时域特性的信息的专门处理,同时通过残差连接使得预测轨迹的前后向传播更加平滑顺畅,再通过轨迹预测网络生成行人交互预测轨迹。
-
-
-
-
-