自然语言处理方法、设备及存储介质

    公开(公告)号:CN109922371B

    公开(公告)日:2021-07-09

    申请号:CN201910180348.6

    申请日:2019-03-11

    Abstract: 本发明实施例提供一种自然语言处理方法、设备及存储介质,该方法包括:获取目标识别结果,该目标识别结果为通过识别用户语音得到的文本信息,用户语音用于查询用户需求;若确定识别结果不为影视名称,则通过预设纠错方法对识别结果进行纠错,得到纠错结果;若通过检错模型判断纠错结果是正确纠错结果,则通过统计分类将纠错结果分配到相应领域,定位相应业务;或者,若通过检错模型判断目标纠错结果是错误纠错结果,则通过统计分类将目标识别结果分配到相应领域,定位相应业务,其中检错模型是预先训练得到的机器学习二分类模型。在得到纠错结果之后,通过检错模型判断纠错结果的合理性,从而提升语义理解的准确度,改善用户体验。

    一种唇语识别方法、服务设备及存储介质

    公开(公告)号:CN112633208A

    公开(公告)日:2021-04-09

    申请号:CN202011599830.2

    申请日:2020-12-30

    Abstract: 本申请公开了一种唇语识别方法、服务设备及存储介质,服务设备首先对目标对象进行视频采集,然后对需要提取唇部信息的每帧目标图像分别执行:从目标图像中提取出目标对象的唇部图像,对唇部图像进行分类识别,将唇部图像划分为发音帧或静默帧,若连续多帧唇部图像的分类识别结果满足从静默帧到发音帧再到静默帧的变化规律,则基于该变化规律从连续多帧唇部图像中定位唇语的起止位置,在获取起始位置之间的唇部图像序列之后,对唇部图像序列进行初步粗分类,筛选掉虽有耦合性但不支持的唇语,对筛选后的唇部图像序列进行唇语识别,得到唇语识别结果。从而可以在除语音交互外,增加基于唇语识别结果的多模态的信号提高人机交互的适用性和稳定性。

    一种关联推荐方法、智能设备及服务设备

    公开(公告)号:CN111914134A

    公开(公告)日:2020-11-10

    申请号:CN202010692647.0

    申请日:2020-07-17

    Abstract: 本申请公开了一种关联推荐方法、智能设备及服务设备,用以依据查询语句进行关联推荐。一种智能设备,包括:输入接口和控制器;所述控制器被配置用于:将通过所述输入接口输入的查询语句发送至服务设备,以使服务设备在已建立的知识图谱中查找目标实体对应的关联实体,所述知识图谱用于表示实体之间的语义关系,所述目标实体为依据所述查询语句确定的实体;从所述服务设备获取所述关联实体并输出。

    分类规则获取方法及装置
    34.
    发明公开

    公开(公告)号:CN111783995A

    公开(公告)日:2020-10-16

    申请号:CN202010537532.4

    申请日:2020-06-12

    Abstract: 本申请提供的分类规则获取方法及装置,能够将经过SWEM模型分类后的数据作为样本数据,并且分别确定所有类别中的第一衡量指数和第二衡量指数最小的目标类别;第一衡量指数最小,说明该目标类别中的数据可分性差,第二衡量指数最小,说明该第二衡量指数对应的两个目标类别之间的可分性差。进而需要确定出这两个目标类别内重合的目标样本数据,并对目标样本数据的类别进行修改,以使其与其他类别明显区分,形成包含预设分类规则在内的新的分类规则。本申请的技术方案能够根据衡量指数确定需要修改类别的目标样本数据,形成更加具体和准确的分类规则,可应用于多版本迭代的数据集,适用范围比较广。

    绘本生成方法及显示设备
    35.
    发明公开

    公开(公告)号:CN119991870A

    公开(公告)日:2025-05-13

    申请号:CN202411982385.6

    申请日:2024-12-31

    Abstract: 本申请涉及一种绘本生成方法及显示设备,涉及显示设备技术领域。该方法包括:接收到绘本生成需求信息,识别出绘本生成需求信息对应的文本信息;将文本信息输入文本处理模型,得到绘本角色信息和绘本主题信息;利用绘本角色信息和绘本主题信息,从预设的绘本风格信息中筛选出相匹配的目标绘本风格信息,以及从预设的播报音色信息中筛选出相匹配的目标播报音色信息;从预设的背景音频信息中,筛选出与绘本主题信息和目标绘本风格信息相匹配的目标背景音频信息;基于绘本角色信息、绘本主题信息、目标绘本风格信息、目标播报音色信息和目标背景音频信息,进行绘本生成处理,得到与绘本生成需求信息对应的绘本。本申请能够提升绘本生成处理的效率。

    一种虚拟数字人的生成方法、装置和电子设备

    公开(公告)号:CN119968653A

    公开(公告)日:2025-05-09

    申请号:CN202380070288.7

    申请日:2023-08-14

    Abstract: 本申请提供一种虚拟数字人的生成方法、装置和电子设备,涉及人机交互技术领域,用于解决如何保证用户执行电子设备播放的健身视频对应的健身动作的一致性的问题。该方法包括:获取播放目标视频时图像采集装置采集的第一帧图像;对第一帧图像进行人体关键识别,确定人体关键点之间的位置信息、目标身体部位的第一实际长度以及除目标身体部位以外的其它身体部位的第二实际长度;根据目标比例关系和第一实际长度,确定除目标身体部位以外的其它身体部位的第预测长度;基于第二实际长度和所述预测长度,确定其它身体部位的绘制高度;基于第一实际长度、绘制高度以及位置关系进行绘制,生成虚拟数字人。

    服务器及文本纠错方法
    37.
    发明授权

    公开(公告)号:CN113836935B

    公开(公告)日:2024-12-17

    申请号:CN202111057489.2

    申请日:2021-09-09

    Inventor: 潘程 王敏 杨善松

    Abstract: 本申请实施例提供了一种服务器及文本纠错方法,服务器被配置为:对接收到的语音命令进行语音识别,得到待纠错文本;对所述待纠错文本进行检错,得到所述待纠错文本对应的待纠错实体;通过多种召回方法对所述待纠错实体进行候选召回,得到多个候选实;根据所述待纠错实体在多个预设层面的特征计算每个候选实体的概率,根据每个候选实体的概率确定所述待纠错实体对应的纠错后实体。本申请实施例通过多种召回方法对所述待纠错实体进行候选召回,实现了多视角召回,得到的候选实体数量众多且非常全面,根据每个候选实体的概率确定纠错后实体,提高了纠错准确率,能够很好地解决常见文本错误类型的文本错误。

    一种服务器、显示设备及数字人交互方法

    公开(公告)号:CN117809681A

    公开(公告)日:2024-04-02

    申请号:CN202311267849.0

    申请日:2023-09-27

    Abstract: 本申请一些实施例示出一种服务器、显示设备及数字人交互方法,所述方法包括:在接收到显示设备发送用户输入的语音数据后,获取用户图像数据,以及根据语音数据确定播报文本;将用户图像数据映射到三维空间,得到形象系数;确定情感系数序列;基于播报文本、形象系数和情感系数序列生成数字人图像数据;基于播报文本生成播报语音;将播报语音和数字人图像数据发送至显示设备,以使显示设备基于数字人图像数据显示数字人图像并播放播报语音。本申请实施例通过将获取到的用户图像数据映射到三维空间,在三维空间可根据高拟人化的情感编辑实现对表情的可控调节,使数字人表情更加拟真人化。

    一种服务器、显示设备及数字人交互方法

    公开(公告)号:CN117809679A

    公开(公告)日:2024-04-02

    申请号:CN202311258675.1

    申请日:2023-09-27

    Abstract: 本申请一些实施例示出一种服务器、显示设备及数字人交互方法,所述方法包括:在接收语音数据后,获取用户图像数据及与原始关键点数据,以及根据所述语音数据确定播报文本;基于语音数据确定回复情感;将播报文本及回复情感输入情感映射语音驱动模型,得到情感语音关键点序列;将情感语音关键点序列对应替换到原始关键点序列中,生成人脸关键点序列;基于用户图像数据和人脸关键点序列生成数字人图像数据;基于播报文本生成播报语音;将播报语音和数字人图像数据发送至所述显示设备。本申请实施例通过情感映射语音驱动模型实现关键点数据从中性到其他情感的映射,使得生成的数字人在具备与语音内容对应的口型的同时,表情更为丰富和自然。

    一种服务器、显示设备及语音交互方法

    公开(公告)号:CN117809617A

    公开(公告)日:2024-04-02

    申请号:CN202311267720.X

    申请日:2023-09-27

    Inventor: 马宏 杨善松 马明

    Abstract: 本申请一些实施例示出一种服务器、显示设备及语音交互方法,所述方法包括:接收显示设备发送用户输入的语音数据;将所述语音数据输入至情感语音模型,以获取情感类型和情感强度,所述语音情感模型是基于不同人群针对多个语义场景的样本语音数据训练得到的;获取所述语音数据对应的播报文本;基于所述播报文本、所述情感类型及所述情感强度合成播报语音;将所述播报语音发送至所述显示设备,以使所述显示设备播放所述播报语音。本申请实施例结合交互场景及用户语音特征综合输出对语音合成文本的情感干预,从而使语音交互过程更加自然,提升语音交互的个性化特征,丰富语音交互播报的情感音色。

Patent Agency Ranking