语音识别方法、模型的训练方法、装置、电子设备和车辆

    公开(公告)号:CN119889300A

    公开(公告)日:2025-04-25

    申请号:CN202510095203.1

    申请日:2025-01-21

    Abstract: 本发明涉及一种语音识别方法、模型的训练方法、装置、电子设备和车辆,包括对混合音频流进行特征提取,得到目标对象的第一音频特征和所述目标对象之外的其他对象的第二音频特征,混合音频流中包括至少两个对象的语音,目标对象为从至少两个对象中区分的一个对象;根据第一音频特征,获得目标对象发出的语音的第一特征向量;根据第二音频特征,预测得到与目标对象可能发出的语音关联的第二特征向量;根据第一特征向量和第二特征向量,识别得到混合音频流中目标对象发出的语音对应的目标文本。本发明实施例通过双路径提取的特征来识别混合音频流中目标对象的语音,可以提高对混合音频流的识别准确度。

    一种行泊一体交互方法及装置
    3.
    发明公开

    公开(公告)号:CN116901934A

    公开(公告)日:2023-10-20

    申请号:CN202310875610.5

    申请日:2023-07-17

    Abstract: 本发明涉及一种行泊一体交互方法及装置,包括:在车载终端加载3D车控界面;判断车辆的运行模式;当车辆的运行模式为行车模式时,使用所述3D车控界面中的虚拟摄像头,显示车辆行驶区域的3D路况地图;对所述3D路况地图的车辆进行泊车功能分析,获取泊车结果;根据所述泊车结果调整所述虚拟摄像头的视角;在所述车载终端显示调整视角后的车辆的3D路况地图及车辆的目标停车位;根据所述目标停车位进行泊车,以解决现有技术中的汽车行驶场景和停车场景无法交互的问题。

    投屏帧率动态调整方法、装置、系统、车辆及存储介质

    公开(公告)号:CN120017896A

    公开(公告)日:2025-05-16

    申请号:CN202510076702.6

    申请日:2025-01-17

    Abstract: 本发明涉及生态共享技术领域,公开了投屏帧率动态调整方法、装置、系统、车辆及存储介质,本发明基于投屏系统的硬件能力和投屏设置参数,确定投屏帧率的上下限参数,实时获取当前投屏系统的第一性能数据和与投屏系统建立投屏连接的移动端的第二性能数据,再基于投屏帧率的上限和下限参数、第一性能数据和第二性能数据,确定目标投屏帧率,最后基于目标投屏帧率调整投屏系统的投屏帧率值,既平衡了投屏系统的稳定性和视频质量,且在确定投屏帧率时考虑了系统的软硬件性能、负载情况,实现降低双端设备的发热,提升用户使用体验的同时节能减排。

    一种混响方法、装置、车机、存储介质及程序产品

    公开(公告)号:CN119811353A

    公开(公告)日:2025-04-11

    申请号:CN202510028650.5

    申请日:2025-01-08

    Abstract: 本发明涉及音频处理技术领域,具体涉及一种混响方法、装置、车机、存储介质及程序产品,其中混响方法通过将待处理音频信号输入到经过训练的学习模型中,得到与待处理音频信号相对应的混响参数,将混响参数输入到Moorer混响模型中得到第一数组集合;进一步可以根据第一数组集合中混响延时数组的第一数量自适应调整Moorer混响模型中参与混响处理的梳状滤波器的数量,提高Moorer混响模型的实时性。

    行泊数据处理方法、装置、设备及系统

    公开(公告)号:CN117962911A

    公开(公告)日:2024-05-03

    申请号:CN202410061812.0

    申请日:2024-01-15

    Abstract: 本申请涉及一种行泊数据处理方法、装置、设备及系统,涉及汽车技术领域。该方法包括:数据处理模块确定车辆在当前时刻的下一时刻的目标驾驶模式。进一步的,数据处理模块在目标驾驶模式为行车模式的情况下,基于数据处理模块与渲染模块之间的标准化接口,对从行车域控制器接收到的行车数据进行处理,并将处理后的行车数据确定为目标待渲染数据;在目标驾驶模式为泊车模式的情况下,基于标准化接口,对从泊车域控制器接收到的泊车数据进行处理,并将处理后的泊车数据确定为目标待渲染数据。进一步的,数据处理模块向渲染模块发送目标待渲染数据。由此,降低了用户对于不同驾驶模式渲染出的驾驶场景在切换时的感知,实现驾驶场景的无缝切换。

    车辆交互方法、装置、电子设备、存储介质及车辆

    公开(公告)号:CN117235320A

    公开(公告)日:2023-12-15

    申请号:CN202311211437.5

    申请日:2023-09-19

    Abstract: 本发明提供一种车辆交互方法、装置、电子设备、存储介质及车辆,涉及车辆技术领域,所述方法包括:接收用户输入的多模态信息;其中,所述多模态信息包括文字、语音、图片或视频中的至少一种;根据所述多模态信息,确定用户意图文本;将所述用户意图文本输入预设的交互分析模型,并获取所述交互分析模型输出的交互分析结果;其中,所述交互分析模型是根据场景数据集对待训练的大语言模型进行模型训练后得到的,所述场景数据集是根据对应的用车场景下的车辆数据和/或用户数据生成的;根据所述交互分析结果,显示动态交互画面并输出场景交互语音;其中,所述场景交互语音与所述动态交互画面相匹配。可以提升用户与车辆的交互效果。

    车载应用软件的管理方法、装置、电子设备及存储介质

    公开(公告)号:CN116483422A

    公开(公告)日:2023-07-25

    申请号:CN202310430762.4

    申请日:2023-04-19

    Abstract: 本申请涉及车辆软件管理技术领域,特别涉及一种车载应用软件的管理方法、装置、电子设备及存储介质,其中,方法包括:获取车载应用软件的当前管理需求;基于当前管理需求,确定目标车辆的至少一个待管理软件和每个待管理软件的最佳管理策略;根据每个待管理软件的最佳管理策略对每个待管理软件进行管理,并根据每个待管理软件的管理结果得到车载应用软件最终管理报告。根据本申请实施例的车载应用软件的管理方法,基于对车辆应用软件的管理需求,通过多种管理策略以实现车辆应用软件的快速实施、部署、测试的全链路闭环,从而提升了应用软件的维护、测试等效率。

    车辆控制方法、装置、设备及介质

    公开(公告)号:CN119811396A

    公开(公告)日:2025-04-11

    申请号:CN202510044082.8

    申请日:2025-01-10

    Abstract: 本发明涉及一种车辆控制方法、装置、设备及介质,该方法包括:获取车辆中目标用户的语音数据和视频数据,并将语音数据和视频数据输入指令生成模型,获取指令生成模型输出的目标指令文本。之后,通过目标指令文本对车辆进行控制。其中,指令生成模型用于对语音数据对应的音频特征以及视频数据对应的图像特征进行融合,进而生成目标指令文本,音频特征包括第一文本子特征和第一情绪子特征,图像特征包括第二文本子特征和第二情绪子特征,第一情绪子特征用于表示目标用户说话的语气、语调、音量中的至少一项,第二情绪子特征用于表示目标用户的面部表情和/或唇部变化。本发明提高了对车辆控制的准确度,提高用户的驾乘体验。

    语音降噪增强方法、装置、产品、车载语音降噪增强系统

    公开(公告)号:CN117995212A

    公开(公告)日:2024-05-07

    申请号:CN202410230333.7

    申请日:2024-02-29

    Abstract: 本发明实施例提供一种语音降噪增强方法、装置、产品、车载语音降噪增强系统。该方法包括:标注初始通道音频数据,获得通道音频数据;对通道音频数据处理,获得增强特征;将原音频标签的增强特征融合降噪,获得原音频特征,将噪声音频标签的增强特征融合降噪,获得噪声音频特征;对原音频特征和噪声音频特征多通道维纳滤波,获得原音频滤波特征和噪声音频滤波特征;根据原音频滤波特征和噪声音频滤波特征,确定目标音频数据。旨在降低语音降噪增强的资源占用和提升降噪增强效果。

Patent Agency Ranking