一种服务器、显示设备及数字人交互方法

    公开(公告)号:CN117809682A

    公开(公告)日:2024-04-02

    申请号:CN202311269508.7

    申请日:2023-09-27

    Inventor: 付爱国 杨善松

    Abstract: 本申请一些实施例示出一种服务器、显示设备及数字人交互方法,所述方法包括:接收显示设备发送用户输入的语音数据;基于所述语音数据确定播报语音;提取所述播报语音的语音特征;基于所述语音特征确定口型参数;确定情感参数以及获取用户图像数据;基于所述用户图像数据、所述情感参数和所述口型参数生成数字人图像数据;将所述播报语音和所述数字人图像数据发送至所述显示设备,以使所述显示设备播放所述播报语音并基于所述数字人图像数据显示数字人图像。本申请实施例根据用户输入的语音数据确定表情参数及口型参数,将表情参数及口型参数结合生成具有较好面部表情表达的数字人图像,实现情感定制和控制。

    一种语音去噪方法、装置和电子设备

    公开(公告)号:CN117809669A

    公开(公告)日:2024-04-02

    申请号:CN202311354637.6

    申请日:2023-10-18

    Abstract: 本公开涉及语音处理技术领域,尤其涉及一种语音去噪方法、装置和电子设备,用于解决如何提升电子设备的语音识别的识别准确率的问题。该方法包括:获取待识别语音数据;对待识别语音数据进行小波包分解,得到至少一个实际子信号;基于实际子信号,确定每个实际子信号对应的第一参数信息;其中,第一参数信息包括实际子信号对应的实际频带的频带能量和实际子信号中共振峰的频带能量占比;基于第一参数信息和待识别语音数据的第二参数信息,确定每个实际子信号的增益值;其中,第二参数信息包括频谱平坦度和基因周期;基于每个实际子信号的增益值,以及每个实际子信号对应的实际频带的乘积,得到每个实际子信号对应的噪声抑制后的抑制频带;对抑制频带进行重构,得到去噪后的待识别语音数据。

    语音信号的处理设备及方法
    23.
    发明公开

    公开(公告)号:CN117649848A

    公开(公告)日:2024-03-05

    申请号:CN202211632447.1

    申请日:2022-12-19

    Abstract: 本申请实施例提供了一种语音信号的处理设备及方法,涉及语音处理技术领域。该语音信号的处理方法包括:检测器,被配置为获取语音信号;控制器,被配置为:提取所述语音信号的各个音频帧的语义特征和情绪特征,然后对所述语音信号的各个语音帧的语义特征和情绪特征进行多模态双线性池化,再获取所述语音信号的各个语音帧的融合特征,最终对所述语音信号的各个语音帧的融合特征进行合并,得到所述语音信号的声学特征,本申请实施例用于解决在提取语音特征时,语音特征的表达能力不强的问题。

    模型训练方法、图像生成方法、装置、设备和介质

    公开(公告)号:CN114724209A

    公开(公告)日:2022-07-08

    申请号:CN202210247058.0

    申请日:2022-03-14

    Inventor: 付爱国 杨善松

    Abstract: 本公开涉及一种模型训练方法、图像生成方法、装置、设备和介质;其中,该方法包括:基于第一训练样本对第一网络模型进行训练,得到训练后的第一目标模型,第一训练样本包括第一人脸图像、第一人脸图像对应的人脸关键点图像、目标图像、目标图像的目标人脸关键点图像以及目标图像的人脸关键点数据;基于第二训练样本对第二网络模型和第一目标模型进行训练,得到训练后的图像生成模型,第二训练样本包括第一目标模型生成的第二人脸图像和目标图像。本公开实施例通过先对第一网络模型进行训练,得到第一目标模型,再对第二网络模型和第一目标模型进行联合训练,得到图像生成模型,使得图像细节生成效果更好,且有利于提高数字人图像的生成效果。

    语句的处理方法、装置及电子设备

    公开(公告)号:CN114239601A

    公开(公告)日:2022-03-25

    申请号:CN202111355670.1

    申请日:2021-11-16

    Inventor: 杨善松 王敏

    Abstract: 本申请提供一种语句的处理方法、装置及电子设备,在对待处理语句进行处理时,通过多头注意力机制模型,将语句中每个词语的标签信息与其上下文词语的标签信息之间一起出现的概率进行考虑,从而将整个语句的标签信息融入到每个文字的信息中,实现了将待处理语句以及标签信息融合进行处理和识别,因此能够更加准确地确定出语句中每个词语的标签信息,即确定出语句中的词槽,进而可以更加准确地确定语句所对应的意图,保证后续可以准确地确定语句的命令,最终准确执行用户指示的命令。

    一种语义槽提取方法及显示设备
    27.
    发明公开

    公开(公告)号:CN114155846A

    公开(公告)日:2022-03-08

    申请号:CN202010831548.6

    申请日:2020-08-18

    Abstract: 本申请公开了一种语义槽提取方法及显示设备,提高提取语义槽的准确性。该方法包括:响应于用户发送的请求,对所述请求进行深度学习的语义槽位解析,确定第一语义槽;检测所述请求的第一语义槽是否出现错误,如果出现错误,则对所述请求中与第一语义槽对应的内容进行修改,得到修改后的请求;对修改后的请求进行文法语义槽位解析,确定第二语义槽;将所述第一语义槽和第二语义槽结合,得到所述请求的语义槽。

    问答方法及装置
    28.
    发明公开

    公开(公告)号:CN114138929A

    公开(公告)日:2022-03-04

    申请号:CN202111146241.3

    申请日:2021-09-28

    Abstract: 本申请实施例提供一种问答方法及装置,该方法包括:确定自然查询语句的主实体;根据所述主实体,构建所述自然查询语句的语义查询图,所述语义查询图用于指示与所述主实体关联的关系或属性;根据所述语义查询图,输出所述自然查询语句对应的自然答案语句。本申请实施例的方案,无需预先设置问答模板,而是首先对主实体进行识别,然后基于主实体构建语义查询图,实现对自然查询语句的理解,进而输出自然答案语句,效率较高,工作量较小,且语义理解更加准确。

    应答方法、装置、设备及存储介质

    公开(公告)号:CN114117000A

    公开(公告)日:2022-03-01

    申请号:CN202111333097.4

    申请日:2021-11-11

    Inventor: 陈冉 杨善松

    Abstract: 本申请提供一种应答方法、装置、设备及存储介质,该方法获取问题,对问题进行解析处理,得到问题对应的实体列表、类型列表、约束列表和属性值列表;将问题输入至预设分类模型,根据输出结果确定问题对应的问题类型;若问题类型不是事实型问题,则对问题进行转换处理,得到至少一个目标事实型问题;根据实体列表、类型列表、约束列表、属性值列表和至少一个目标事实型问题,生成问题查询图;根据问题查询图,在预设知识图谱中进行查询,得到应答结果,根据问题查询图可准确在知识图谱中确定问题对应的应答结果,提高了应答的准确率和效率,进一步地提高了用户体验。

    一种信息交互方法及设备
    30.
    发明公开

    公开(公告)号:CN113139036A

    公开(公告)日:2021-07-20

    申请号:CN202010067585.4

    申请日:2020-01-20

    Abstract: 本申请提出一种信息交互方法及设备。该方法包括:接收接收来自于智能设备的查询请求,根据查询请求得到用户查询语句文本;获取知识库中与所述查询语句文本中实体指称对应的实体,并选择一个核心实体,根据所述核心实体的属性信息得到所述核心实体的候选三元组集合;抽取所述用户查询语句文本中的关系信息得到关系集合,将所述关系集合中的关系分别与所述核心实体组合得到候选逻辑表达式集合;筛选所述候选逻辑表达式,得到所述查询请求对应的候选答案集合;根据所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度选择所述查询请求对应的答案;向所述智能设备发送查询响应,所述查询响应携带所述查询请求对应的答案。

Patent Agency Ranking