Patent search ap:("重庆长安汽车股份有限公司") AND inv:"苏鹏飞" Page 1

1.

发明公开
一种多模态娱乐交互方法、装置、设备及介质审中-实审

公开(公告)号：CN116610212A

公开(公告)日：2023-08-18

申请号：CN202310481822.5

申请日：2023-04-28

Applicant: 重庆长安汽车股份有限公司

Inventor： 胡春华 , 贺刚 , 王永亮 , 平涛 , 苏鹏飞

IPC: G06F3/01 , G06V40/20 , G06V10/80

Abstract: 本申请涉及座舱控制技术领域，提供了一种多模态娱乐交互方法、装置、设备及介质，方法包括：获取用户的手势信息、体态信息、视线方向信息、声源定位信息；根据声源定位信息确定用户位置，并根据视线方向信息确定用户位置处的娱乐信息目标显示区域；将手势信息与预先构建的手势库中的候选手势进行匹配，得到目标手势；调用与目标手势对应的目标手势控制参数，并根据目标手势控制参数调整所述娱乐信息的输出效果；将手势信息、体态信息、视线方向信息和声源定位信息传输至预先构建的环境灯光控制参数生成模型，得到环境灯光控制参数，并根据环境灯光控制参数调整预先配置的环境灯光控制单元的输出，完成多模态娱乐交互。

2.

发明公开
车载娱乐交互方法、装置、车辆及存储介质审中-实审

公开(公告)号：CN116400805A

公开(公告)日：2023-07-07

申请号：CN202310324935.4

申请日：2023-03-29

Applicant: 重庆长安汽车股份有限公司

Inventor： 胡春华 , 贺刚 , 王永亮 , 平涛 , 苏鹏飞

IPC: G06F3/01 , G06F3/16

Abstract: 本申请涉及车载娱乐技术领域，特别涉及一种车载娱乐交互方法、装置、车辆及存储介质，其中，方法包括：检测车辆是否进入多模态娱乐交互模式；在车辆进入多模态娱乐交互模式时，识别车内人员的体态信息、手势信息、视觉感知信息和音频信息中的一种或多种；根据体态信息、手势信息、视觉感知信息和音频信息中的一种或多种确定车辆的一个或多个交互组件的交互参数，利用交互参数控制一个或多个交互组件执行交互动作。由此，解决了相关技术中车载娱乐系统基于中控屏幕显示和语音控制交互的局限性，人机交互的互动维度、趣味性和氛围感不足，科技化和智能化体验不高等问题。

3.

发明公开
一种车载语音交互方法、装置、计算机设备及车机审中-实审

公开(公告)号：CN119832913A

公开(公告)日：2025-04-15

申请号：CN202510043049.3

申请日：2025-01-10

Applicant: 重庆长安汽车股份有限公司

Inventor： 苏鹏飞 , 王永亮 , 任伟

IPC: G10L15/22 , G10L17/02 , G10L17/18 , G10L15/26 , G10L15/25 , G10L15/18 , G10L21/0208 , G06V40/16

Abstract: 本发明涉及车辆控制技术领域，具体涉及一种车载语音交互方法、装置、计算机设备及车机，其中车载语音交互方法，通过对初始音频数据进行前处理，得到与每个座舱人员相对应的音频数据；将与每个座舱人员相对应的音频数据输入到预设的多模语音活动检测算法网络进行处理，确定与每个座舱人员相对应的音频数据是否属于真正的用户语音活动，由此可以在对初始音频数据进行处理生成交互指令之前，确定与每个座舱人员相对应的音频数据是否属于真正的用户语音活动，从而降低误唤醒率。

4.

发明公开
关键词识别方法、装置、设备、存储介质及汽车审中-实审

公开(公告)号：CN116935487A

公开(公告)日：2023-10-24

申请号：CN202310928630.4

申请日：2023-07-26

Applicant: 重庆长安汽车股份有限公司

Inventor： 苏鹏飞 , 贺刚 , 刁楷 , 任伟

IPC: G06V40/20 , G06N3/044 , G06N3/0464 , G06V10/764

Abstract: 本发明涉及一种关键词识别方法、装置、设备、存储介质及汽车，包括：获取目标唇部图像区域数据，目标历史特征缓存数据和目标最近特征缓存数据，将目标唇部图像区域数据按照通道维度划分生成第二通道数据；通过第二通道数据、目标历史特征缓存数据与目标唇部图像区域数据生成第一目标网络层的输出数据；通过第一目标网络层的输出数据与目标最近特征缓存数据生成第二目标网络层的输出数据；通过关键词识别模型的第三目标网络层输出第三目标网络层输出数据；通过上述三种输出数据确定标签类别，标签类别用于对用户输出的关键词进行识别，本发明实施例设计计算量少的关键词识别模型，可以实时快速且相对准确的输出检测结果。

Patent Agency Ranking