-
公开(公告)号:CN117475511A
公开(公告)日:2024-01-30
申请号:CN202311383270.0
申请日:2023-10-23
Applicant: 重庆长安汽车股份有限公司
Inventor: 张梦妮
Abstract: 本申请涉及一种手部图像处理方法、装置、设备及存储介质,涉及图像处理技术领域。该方法包括:获取目标深度图像,目标深度图像包括待识别手势。对目标深度图像进行识别,得到感兴趣ROI区域,ROI区域为目标深度图像中由待识别手势的多个手掌关键点围成的区域。获取ROI区域的平均深度值。根据平均深度值和预设延伸距离,确定待识别手势在目标深度图像中的目标深度范围。对目标深度图像中处于目标深度范围的像素点进行直方图均衡化处理,得到待识别图像,待识别图像包括待识别手势。由此,可以提高拍摄的手部图像质量。
-
公开(公告)号:CN119293716A
公开(公告)日:2025-01-10
申请号:CN202411034177.3
申请日:2024-07-30
Applicant: 重庆长安汽车股份有限公司
IPC: G06F18/25 , G06F40/166 , G06F40/30 , G06T3/4038 , G06V40/10 , G06T7/73 , G10L15/22 , G10L15/26
Abstract: 本发明实施例提供了一种车辆多模态交互方法、装置、电子设备及存储介质,包括:获取目标车辆内部的目标用户对应的手指指向区域;采集所述手指指向区域对应的车辆外部图像;在所述车辆外部图像中确定与所述手指指向区域对应的多尺度图像,并基于所述多尺度图像进行多尺度拼接,得到目标拼接图像;采集所述目标用户对应的语音数据;将所述目标拼接图像和所述语音数据输入至预设多模态交互模型,得到回复文本。即本发明实施例通过结合用户的手势指向和语音输入,实现了更加直观和自然的交互体验,综合分析图像和语音信息,从而生成准确且符合用户意图的回复文本。
-