一种信息处理的方法、装置、设备和计算机可读存储介质

    公开(公告)号:CN117456990A

    公开(公告)日:2024-01-26

    申请号:CN202311493631.7

    申请日:2023-11-09

    Abstract: 本申请提供一种信息处理的方法、装置、设备和计算机可读存储介质,该方法包括:识别接收的语音指令对应的第一文本信息;通过训练好的第一AI模型和训练好的第二AI模型分别对第一文本信息进行语义理解,得到对应的第一理解结果和第二理解结果;至少基于第一理解结果和第二理解结果,响应语音指令。如此,通过利用训练好的第一AI模型和训练好的第二AI模型同时对第一文本信息进行语义理解,获得两种理解结果,并结合至少两种理解结果对语音指令进行响应,实现了至少两种AI模型的语义理解优势的结合,从而能够快速理解简单文本信息的语义,减少文本信息语义理解的错误,提升车载对话系统认知理解能力。

    基于视觉追踪的全息投影交互方法、装置、车辆及介质

    公开(公告)号:CN116643649A

    公开(公告)日:2023-08-25

    申请号:CN202310421578.3

    申请日:2023-04-19

    Abstract: 本申请涉及人机交互技术领域,特别涉及一种基于视觉追踪的全息投影交互方法、装置、车辆及介质,包括:检测当前车辆的驾驶状态;根据驾驶状态确定多个转体摄像头和/或多个眼球追踪摄像头的工作状态和全息投影的位置,并在多个转体摄像头处于启用状态时,利用多个转体摄像头采集用户的面部旋转角度;根据面部旋转角度和多个眼球追踪摄像头的工作状态确定至少一个目标眼球追踪摄像头,并获取至少一个目标眼球追踪摄像头采集到的摄像头数据,并基于全息投影的位置和摄像头数据进行全息投影。由此,解决了相关技术中的眼球追踪技术无法适应用户的多角度转动,并且车机交互趣味性低等问题,为车机交互增加趣味性、改善视觉交互体验,提高用户舒适度。

    特征提取方法、装置、训练方法及存储介质

    公开(公告)号:CN116631036A

    公开(公告)日:2023-08-22

    申请号:CN202310641193.8

    申请日:2023-06-01

    Inventor: 任伟 李林

    Abstract: 本发明涉及一种特征提取方法、装置、训练方法及存储介质,所述特征提取方法通过提取人脸图像中的特性信息,生成第一特征图,并基于第一特征图,得到第一特征矩阵和第二特征矩阵,第一特征矩阵表示第一特征图中在第一特征图的第一维度上的特征信息,第二特征矩阵表示第一特征图中在第一特征图的第二维度上的特征信息,再结合第一特征矩阵和第二特征矩阵,以此得到特征信息对应的目标坐标,目标坐标表示特征信息在人脸图像中的位置。由此,通过将第一特征图的第一维度和第二维度上的特征信息分离为一维的第一特征矩阵和第二特征矩阵,以此起到分别在第一维度和第二维度上对第一特征图分析处理的作用,实现了降低计算难度与内存开销的效果。

    语义解析方法、装置、电子设备及存储介质

    公开(公告)号:CN116384406A

    公开(公告)日:2023-07-04

    申请号:CN202310187934.X

    申请日:2023-03-01

    Abstract: 本申请涉及自然语言理解模型领域,特别涉及一种语义解析方法、装置、电子设备及存储介质,其中,方法包括:获取目标语料库,其中,目标语料库包括多个目标区域的用户语义信息,基于每个目标区域的语义特征,对目标语料库中的用户语义信息进行分发,得到每个目标区域的域库,并基于每个目标区域的域库构建每个目标区域的区域语义模型,对每个目标区域的区域语义模型和/或预设的通用语义模型进行模型自适应调整,得到基于城市区域的语义理解模型,以通过基于城市区域的语义理解模型分析接收到的用户语句,完成区域语义解析。由此,通过区域语义的模型迭代和部署方案,解决了区域语义问题,从而提升地区内用户的语义理解功能的使用体验。

    汽车天窗安装定位工装
    15.
    发明授权

    公开(公告)号:CN102350669B

    公开(公告)日:2013-06-19

    申请号:CN201110246216.2

    申请日:2011-08-25

    Abstract: 本发明公开了一种汽车天窗定位工装,包括定位骨架,定位骨架上设置固定有吸盘,定位块和限位柱,所述定位骨架前端的定位块内侧设有纵向间隙卡片,定位骨架的右侧设有横向间隙卡片。该定位工装用于汽车天窗玻璃的定位安装,能够保证天窗玻璃与车顶钣金之间的间隙及高度差,提高调装效率,降低劳动强度,简化操作过程。

    关键词识别方法、装置、设备、存储介质及汽车

    公开(公告)号:CN116935487A

    公开(公告)日:2023-10-24

    申请号:CN202310928630.4

    申请日:2023-07-26

    Abstract: 本发明涉及一种关键词识别方法、装置、设备、存储介质及汽车,包括:获取目标唇部图像区域数据,目标历史特征缓存数据和目标最近特征缓存数据,将目标唇部图像区域数据按照通道维度划分生成第二通道数据;通过第二通道数据、目标历史特征缓存数据与目标唇部图像区域数据生成第一目标网络层的输出数据;通过第一目标网络层的输出数据与目标最近特征缓存数据生成第二目标网络层的输出数据;通过关键词识别模型的第三目标网络层输出第三目标网络层输出数据;通过上述三种输出数据确定标签类别,标签类别用于对用户输出的关键词进行识别,本发明实施例设计计算量少的关键词识别模型,可以实时快速且相对准确的输出检测结果。

    无框车门调整系统及其使用方法
    18.
    发明公开

    公开(公告)号:CN116395062A

    公开(公告)日:2023-07-07

    申请号:CN202310340225.0

    申请日:2023-03-30

    Abstract: 本发明公开了一种无框车门调整系统及其使用方法,涉及汽车总装工艺技术领域,所述无框车门调整系统包括轨道随行子系统、随行小车子系统以及装配调整工装夹具子系统,所述轨道随行子系统与所述随行小车子系统连接,所述随行小车子系统与所述装配调整工装夹具子系统连接;所述随行小车子系统能够带动操作人员以及装配调整工装夹具子系统沿X向以及Y向移动;所述装配调整工装夹具子系统能够进行车门钣金的定位,以及进行车门玻璃的位置调整、限位以及位置检测。本发明能够便于操作人员操作,降低操作人员的劳动强度,保证装配调整精度,还能够增加无框车门调整系统的通用性,实现不同车型的无框车门分装总成的共线生产。

    车辆多模态交互方法、装置、电子设备及存储介质

    公开(公告)号:CN119293716A

    公开(公告)日:2025-01-10

    申请号:CN202411034177.3

    申请日:2024-07-30

    Inventor: 张梦妮 任伟

    Abstract: 本发明实施例提供了一种车辆多模态交互方法、装置、电子设备及存储介质,包括:获取目标车辆内部的目标用户对应的手指指向区域;采集所述手指指向区域对应的车辆外部图像;在所述车辆外部图像中确定与所述手指指向区域对应的多尺度图像,并基于所述多尺度图像进行多尺度拼接,得到目标拼接图像;采集所述目标用户对应的语音数据;将所述目标拼接图像和所述语音数据输入至预设多模态交互模型,得到回复文本。即本发明实施例通过结合用户的手势指向和语音输入,实现了更加直观和自然的交互体验,综合分析图像和语音信息,从而生成准确且符合用户意图的回复文本。

    麦克风控制方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118843040A

    公开(公告)日:2024-10-25

    申请号:CN202410810942.X

    申请日:2024-06-21

    Inventor: 吴富昌 任伟

    Abstract: 本申请涉及一种麦克风控制方法、装置、设备、存储介质及程序产品,涉及汽车技术领域。该方法包括:获取来自第一方向的风噪声的风噪声压级,风噪声压级用于表征风噪声的强度;基于风噪声压级,确定第二方向,并将车辆的麦克风指向的方向调整为第二方向,麦克风用于接收来自麦克风指向的方向的声音。由此,可以根据风噪声压级调整麦克风指向的方向,以抑制麦克风接收的风噪声,避免如果风噪声的风噪声压级超过了麦克风的最大声压级,会导致麦克风录到的音频出现失真,降噪算法无法对失真的音频进行有效处理的问题。

Patent Agency Ranking