一种多模态娱乐交互方法、装置、设备及介质

    公开(公告)号:CN116610212A

    公开(公告)日:2023-08-18

    申请号:CN202310481822.5

    申请日:2023-04-28

    Abstract: 本申请涉及座舱控制技术领域,提供了一种多模态娱乐交互方法、装置、设备及介质,方法包括:获取用户的手势信息、体态信息、视线方向信息、声源定位信息;根据声源定位信息确定用户位置,并根据视线方向信息确定用户位置处的娱乐信息目标显示区域;将手势信息与预先构建的手势库中的候选手势进行匹配,得到目标手势;调用与目标手势对应的目标手势控制参数,并根据目标手势控制参数调整所述娱乐信息的输出效果;将手势信息、体态信息、视线方向信息和声源定位信息传输至预先构建的环境灯光控制参数生成模型,得到环境灯光控制参数,并根据环境灯光控制参数调整预先配置的环境灯光控制单元的输出,完成多模态娱乐交互。

    车载娱乐交互方法、装置、车辆及存储介质

    公开(公告)号:CN116400805A

    公开(公告)日:2023-07-07

    申请号:CN202310324935.4

    申请日:2023-03-29

    Abstract: 本申请涉及车载娱乐技术领域,特别涉及一种车载娱乐交互方法、装置、车辆及存储介质,其中,方法包括:检测车辆是否进入多模态娱乐交互模式;在车辆进入多模态娱乐交互模式时,识别车内人员的体态信息、手势信息、视觉感知信息和音频信息中的一种或多种;根据体态信息、手势信息、视觉感知信息和音频信息中的一种或多种确定车辆的一个或多个交互组件的交互参数,利用交互参数控制一个或多个交互组件执行交互动作。由此,解决了相关技术中车载娱乐系统基于中控屏幕显示和语音控制交互的局限性,人机交互的互动维度、趣味性和氛围感不足,科技化和智能化体验不高等问题。

    关键词识别方法、装置、设备、存储介质及汽车

    公开(公告)号:CN116935487A

    公开(公告)日:2023-10-24

    申请号:CN202310928630.4

    申请日:2023-07-26

    Abstract: 本发明涉及一种关键词识别方法、装置、设备、存储介质及汽车,包括:获取目标唇部图像区域数据,目标历史特征缓存数据和目标最近特征缓存数据,将目标唇部图像区域数据按照通道维度划分生成第二通道数据;通过第二通道数据、目标历史特征缓存数据与目标唇部图像区域数据生成第一目标网络层的输出数据;通过第一目标网络层的输出数据与目标最近特征缓存数据生成第二目标网络层的输出数据;通过关键词识别模型的第三目标网络层输出第三目标网络层输出数据;通过上述三种输出数据确定标签类别,标签类别用于对用户输出的关键词进行识别,本发明实施例设计计算量少的关键词识别模型,可以实时快速且相对准确的输出检测结果。

Patent Agency Ranking