Patent search ap:("重庆长安汽车股份有限公司") AND inv:"王永亮" Page 3

21.

发明公开
一种信息处理的方法、装置、设备和计算机可读存储介质审中-实审

公开(公告)号：CN117456990A

公开(公告)日：2024-01-26

申请号：CN202311493631.7

申请日：2023-11-09

Applicant: 重庆长安汽车股份有限公司

Inventor： 唐乾斌 , 贺刚 , 王永亮 , 任伟

IPC: G10L15/18 , G10L15/26 , G10L15/22 , G10L15/06 , G10L15/16

Abstract: 本申请提供一种信息处理的方法、装置、设备和计算机可读存储介质，该方法包括：识别接收的语音指令对应的第一文本信息；通过训练好的第一AI模型和训练好的第二AI模型分别对第一文本信息进行语义理解，得到对应的第一理解结果和第二理解结果；至少基于第一理解结果和第二理解结果，响应语音指令。如此，通过利用训练好的第一AI模型和训练好的第二AI模型同时对第一文本信息进行语义理解，获得两种理解结果，并结合至少两种理解结果对语音指令进行响应，实现了至少两种AI模型的语义理解优势的结合，从而能够快速理解简单文本信息的语义，减少文本信息语义理解的错误，提升车载对话系统认知理解能力。

22.

发明公开
人声提取方法、装置、产品、无麦车载KTV系统及方法审中-实审

公开(公告)号：CN117198318A

公开(公告)日：2023-12-08

申请号：CN202311213608.8

申请日：2023-09-19

Applicant: 重庆长安汽车股份有限公司

Inventor： 李康清 , 贺刚 , 王永亮 , 平涛 , 刁楷

IPC: G10L25/03 , G10L25/30 , G10L21/028 , G10L21/0208 , H04R3/00 , G10H1/36

Abstract: 本发明实施例提供一种人声提取方法、装置、产品、无麦车载KTV系统及方法。方法包括：对多个融合特征进行多头注意力加权和处理，获得第一中间人声特征；对所述第一中间人声特征进行人声增强处理，获得第二中间人声特征；通过对音频数据进行人声特征提取，获得对应的目标音频特征；将目标音频特征中的第一目标音频特征与所述第二中间人声特征进行相乘处理，获得第一目标人声特征，以及，将加权中间人声特征与目标音频特征中的第二目标音频特征进行相乘处理，获得第二目标人声特征；通过对所述第一目标人声特征和所述第二目标人声特征进行特征转换，获得对应的人声数据。旨在有效提升封闭场景下的人声提取准确度。

23.

发明公开
基于视觉追踪的全息投影交互方法、装置、车辆及介质审中-实审

公开(公告)号：CN116643649A

公开(公告)日：2023-08-25

申请号：CN202310421578.3

申请日：2023-04-19

Applicant: 重庆长安汽车股份有限公司

Inventor： 刘静修 , 贺刚 , 王永亮 , 平涛 , 任伟

IPC: G06F3/01 , G06V40/16 , G06V40/19

Abstract: 本申请涉及人机交互技术领域，特别涉及一种基于视觉追踪的全息投影交互方法、装置、车辆及介质，包括：检测当前车辆的驾驶状态；根据驾驶状态确定多个转体摄像头和/或多个眼球追踪摄像头的工作状态和全息投影的位置，并在多个转体摄像头处于启用状态时，利用多个转体摄像头采集用户的面部旋转角度；根据面部旋转角度和多个眼球追踪摄像头的工作状态确定至少一个目标眼球追踪摄像头，并获取至少一个目标眼球追踪摄像头采集到的摄像头数据，并基于全息投影的位置和摄像头数据进行全息投影。由此，解决了相关技术中的眼球追踪技术无法适应用户的多角度转动，并且车机交互趣味性低等问题，为车机交互增加趣味性、改善视觉交互体验，提高用户舒适度。

24.

发明公开
一种多模态娱乐交互方法、装置、设备及介质审中-实审

公开(公告)号：CN116610212A

公开(公告)日：2023-08-18

申请号：CN202310481822.5

申请日：2023-04-28

Applicant: 重庆长安汽车股份有限公司

Inventor： 胡春华 , 贺刚 , 王永亮 , 平涛 , 苏鹏飞

IPC: G06F3/01 , G06V40/20 , G06V10/80

Abstract: 本申请涉及座舱控制技术领域，提供了一种多模态娱乐交互方法、装置、设备及介质，方法包括：获取用户的手势信息、体态信息、视线方向信息、声源定位信息；根据声源定位信息确定用户位置，并根据视线方向信息确定用户位置处的娱乐信息目标显示区域；将手势信息与预先构建的手势库中的候选手势进行匹配，得到目标手势；调用与目标手势对应的目标手势控制参数，并根据目标手势控制参数调整所述娱乐信息的输出效果；将手势信息、体态信息、视线方向信息和声源定位信息传输至预先构建的环境灯光控制参数生成模型，得到环境灯光控制参数，并根据环境灯光控制参数调整预先配置的环境灯光控制单元的输出，完成多模态娱乐交互。

25.

发明公开
车载娱乐交互方法、装置、车辆及存储介质审中-实审

公开(公告)号：CN116400805A

公开(公告)日：2023-07-07

申请号：CN202310324935.4

申请日：2023-03-29

Applicant: 重庆长安汽车股份有限公司

Inventor： 胡春华 , 贺刚 , 王永亮 , 平涛 , 苏鹏飞

IPC: G06F3/01 , G06F3/16

Abstract: 本申请涉及车载娱乐技术领域，特别涉及一种车载娱乐交互方法、装置、车辆及存储介质，其中，方法包括：检测车辆是否进入多模态娱乐交互模式；在车辆进入多模态娱乐交互模式时，识别车内人员的体态信息、手势信息、视觉感知信息和音频信息中的一种或多种；根据体态信息、手势信息、视觉感知信息和音频信息中的一种或多种确定车辆的一个或多个交互组件的交互参数，利用交互参数控制一个或多个交互组件执行交互动作。由此，解决了相关技术中车载娱乐系统基于中控屏幕显示和语音控制交互的局限性，人机交互的互动维度、趣味性和氛围感不足，科技化和智能化体验不高等问题。

26.

发明公开
语义解析方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN116384406A

公开(公告)日：2023-07-04

申请号：CN202310187934.X

申请日：2023-03-01

Applicant: 重庆长安汽车股份有限公司

Inventor： 王路宝 , 贺刚 , 王永亮 , 平涛 , 任伟

IPC: G06F40/30 , G06F16/332 , G06F16/33

Abstract: 本申请涉及自然语言理解模型领域，特别涉及一种语义解析方法、装置、电子设备及存储介质，其中，方法包括：获取目标语料库，其中，目标语料库包括多个目标区域的用户语义信息，基于每个目标区域的语义特征，对目标语料库中的用户语义信息进行分发，得到每个目标区域的域库，并基于每个目标区域的域库构建每个目标区域的区域语义模型，对每个目标区域的区域语义模型和/或预设的通用语义模型进行模型自适应调整，得到基于城市区域的语义理解模型，以通过基于城市区域的语义理解模型分析接收到的用户语句，完成区域语义解析。由此，通过区域语义的模型迭代和部署方案，解决了区域语义问题，从而提升地区内用户的语义理解功能的使用体验。

Patent Agency Ranking