-
公开(公告)号:CN118012550A
公开(公告)日:2024-05-10
申请号:CN202410020594.6
申请日:2024-01-05
Applicant: 中国第一汽车股份有限公司 , 一汽(北京)软件科技有限公司
Abstract: 本申请公开了一种播放器背景图控制方法、播放器背景图控制装置、电子设备、存储介质及车辆,方法包括,获取播放器播放的音乐文件信息;所述音乐文件信息包括,文本信息和音频信息;其中,根据所述音乐文件信息,生成播放器背景图;根据音乐文件在播放器的播放进程,对应文本信息或/和音频信息控制所述背景图的显示状态。通过上述方案解析歌曲相关的文本信息,获得语义信息,并根据语义信息,抽取背景元素和主题元素,生成构图的空间架构,并在空间架构上生成视角用于显示终端的显示,相对于传统依据音乐作品产生的视觉信息,开发了语言的信息丰富且具象的优势。
-
公开(公告)号:CN119089243A
公开(公告)日:2024-12-06
申请号:CN202411138041.7
申请日:2024-08-19
Applicant: 中国第一汽车股份有限公司 , 一汽(北京)软件科技有限公司
IPC: G06F18/24 , G06F18/25 , G06F18/214 , G06N3/0455 , G06N3/0464 , G06N3/082 , G06N3/092
Abstract: 本发明涉及车辆技术领域,公开了一种多模态交互引导车辆操作的方法、系统、电子设备、存储介质及车辆,包括响应于采集的原始数据进行标注,分配相应的样本标签,响应于标注后的原始数据,对原始数据进行训练,构建多模态感知模型以及引导策略生成模型,以识别用户行为以及车辆状态,并生成引导策略;响应于车辆使用过程中,基于训练好的所述多模态感知模型对车辆使用数据进行分析,以感知用户和车辆的状态;响应于感知的所述车辆使用数据,基于训练好的所述引导策略生成模型,生成并输出符合用户当前需求的引导策略。本发明可实时感知用户和车辆状态,根据用户的实际情况提供相应的引导策略,并提供相应的交互方式,提升用户的使用体验。
-
公开(公告)号:CN118072726A
公开(公告)日:2024-05-24
申请号:CN202410013740.2
申请日:2024-01-04
Applicant: 中国第一汽车股份有限公司 , 一汽(北京)软件科技有限公司
Abstract: 本申请公开了一种车辆用角色化语音模型选取方法、语音交互方法及装置。所述车辆用角色化语音模型选取方法包括:获取待使用角色信息;根据待使用角色信息获取经过训练的最终待使用角色化语音模型。本申请的车辆用角色化语音模型选取方法可以让车内人员快速的选择喜欢的角色化语音模型,通过与角色化语音模型进行交互,能够获取到该角色化语音模型的个性语音内容。
-
公开(公告)号:CN117975958A
公开(公告)日:2024-05-03
申请号:CN202410025049.6
申请日:2024-01-08
Applicant: 中国第一汽车股份有限公司 , 一汽(北京)软件科技有限公司
IPC: G10L15/22 , G10L15/06 , G10L15/065 , G10L13/02 , G10L13/027
Abstract: 本申请公开了一种车辆语音交互方法、车辆语音交互装置、电子设备、存储介质及车辆,方法包括,获取用户语音数据;解析所述语音数据,识别用户情感化需求和基本功能需求;根据所述用户情感化需求和基本功能需求,生成情感化自然语言提示工程;根据所述情感化自然语言提示工程,进行AIGC模型训练,生成风格化自然语言模板;根据所述风格化自然语言模板,生成对应所述用户情感化需求和基本功能需求的语音交互文案。通过上述方案,基于识别用户情感化需求和基本功能需求,生成风格化自然语言模板,基于风格化自然语言模板高效的生成使语音交互文案,提高了语音交互的拟人化程度。
-
公开(公告)号:CN117818516A
公开(公告)日:2024-04-05
申请号:CN202410106397.6
申请日:2024-01-25
Applicant: 中国第一汽车股份有限公司 , 一汽(北京)软件科技有限公司
IPC: B60R16/037 , G06V40/20 , G10K11/16
Abstract: 本发明公开了一种通话环境控制方法、系统、电子设备、存储介质及车辆,包括基于实时获取的车内图像信息,判断当前车内人员是否处于通话状态,当车内人员处于所述通话状态时,获取当前车内噪声数据,分别对发出噪声数据的噪声源以及相应的车内人员进行定位,获取噪声源相对于车内人员的噪声距离;基于噪声距离,根据定义的调节算法,计算达到预设目标噪声值所需的调节比例,通过调节比例,对噪声源进行动态调节,直至噪声数据达到目标噪声值;响应于车内人员结束通话状态的控制信号,控制噪声源将噪声数据还原至初始状态。通过自动调节噪音源,有效降低座舱内的噪音干扰,乘客无需进行手动操作,即可实现噪音源的自动调节且调节效果稳定准确。
-
公开(公告)号:CN118833240A
公开(公告)日:2024-10-25
申请号:CN202410838816.5
申请日:2024-06-26
Applicant: 中国第一汽车股份有限公司 , 一汽(北京)软件科技有限公司
Abstract: 本申请公开一种基于驾驶过程的历史场景再现方法、装置、电子设备及存储介质,方法包括,获取驾驶路径信息;根据所述驾驶路径,获取沿途历史信息;获取车辆在所述驾驶路径的位置信息;根据所述位置信息,调取所述历史信息;根据所述历史信息,进行座舱内人机终端控制。通过上述方案,调取历史数据库,围绕车辆行进路线进行再现输出,使驾驶过程从单调的媒体娱乐,升级为虚拟现实与现实场景同步的样式。调取车辆安全主题的历史数据,使车辆行驶过程中,对司机进行安全注意的训练,提高司机规避交通安全风险的能力。通过以特定的主题进行人机交互,使虚拟现实的能力与历史数据紧密结合,提高了用户驾驶体验的丰富度。
-
公开(公告)号:CN118675510A
公开(公告)日:2024-09-20
申请号:CN202410791644.0
申请日:2024-06-19
Applicant: 中国第一汽车股份有限公司 , 一汽(北京)软件科技有限公司
Abstract: 本申请公开了一种流式语义时序管理方法、装置、电子设备及存储介质,方法包括:获取用户一段连续语音;根据所述连续语音解析多个语义;根据所述解析多个语义,进行语义的预分类处理;根据语义的所述预分类处理,排列基于语义产生执行动作的执行优先级。通过上述方案,对语音解析语义进行语义的预分类处理,按照语义执行结果可能产的相互干扰,调整对语义执行的顺序。将复合语义和非复合语义进行区分,预判语义执行带来的干扰风险,控制语义执行的顺序,降低受复合语义执行影响的可能。通过执行基于语义产生执行动作对其他语义基于语义产生执行动作的干扰或引起的系统关闭,对语义进行预分类处理,尽量让所有语义都被执行。
-
-
-
-
-
-