语音识别方法、装置、电子设备及存储介质

    公开(公告)号:CN113628615B

    公开(公告)日:2022-01-04

    申请号:CN202111185130.3

    申请日:2021-10-12

    Abstract: 本发明提供一种语音识别方法、装置、电子设备及存储介质,其中方法包括:获取待识别语音对应的脉冲序列;将脉冲序列输入至语音识别模型,得到待识别语音对应的语音识别结果;语音识别模型是基于循环脉冲神经网络构建的,语音识别模型隐藏层中任一神经元的膜电位是基于前向通道中的神经元脉冲标志和循环通道中的神经元脉冲标志确定的,同一隐藏层中的神经元的输出采用稀疏连接;前向通道用于连接任一神经元与上一隐藏层中的神经元;循环通道用于连接任一神经元在上一时刻的输出与当前时刻同层的其他神经元的输出。本发明提供的方法、装置、电子设备及存储介质,能够适应于识别样本的变化,提高了模型的鲁棒性,提高了识别结果的准确性。

    语音识别方法、装置、电子设备及存储介质

    公开(公告)号:CN113628615A

    公开(公告)日:2021-11-09

    申请号:CN202111185130.3

    申请日:2021-10-12

    Abstract: 本发明提供一种语音识别方法、装置、电子设备及存储介质,其中方法包括:获取待识别语音对应的脉冲序列;将脉冲序列输入至语音识别模型,得到待识别语音对应的语音识别结果;语音识别模型是基于循环脉冲神经网络构建的,语音识别模型隐藏层中任一神经元的膜电位是基于前向通道中的神经元脉冲标志和循环通道中的神经元脉冲标志确定的,同一隐藏层中的神经元的输出采用稀疏连接;前向通道用于连接任一神经元与上一隐藏层中的神经元;循环通道用于连接任一神经元在上一时刻的输出与当前时刻同层的其他神经元的输出。本发明提供的方法、装置、电子设备及存储介质,能够适应于识别样本的变化,提高了模型的鲁棒性,提高了识别结果的准确性。

    一种机器人控制方法、装置及存储介质

    公开(公告)号:CN113561185A

    公开(公告)日:2021-10-29

    申请号:CN202111113736.6

    申请日:2021-09-23

    Abstract: 本公开涉及一种机器人控制方法、装置及存储介质,上述方法包括:获取机器人的运动轨迹集;确定所述机器人对应的机器人逆动力学模型,并确定所述机器人逆动力学模型对应的误差函数;根据所述运动轨迹集和所述误差函数对所述机器人逆动力学模型进行自监督训练;根据经过所述自监督训练之后的机器人逆动力学模型,对所述机器人进行控制。采用上述技术手段,解决现有技术中,缺少关于通过机器人逆动力学学习控制机器人的方案的问题。

    一种文本纠错方法及系统
    65.
    发明公开

    公开(公告)号:CN113011149A

    公开(公告)日:2021-06-22

    申请号:CN202110242123.6

    申请日:2021-03-04

    Inventor: 董倩倩 徐爽 徐波

    Abstract: 本发明提供一种文本纠错方法及系统。其中,文本纠错方法包括:获取待处理文本序列,将所述待处理文本序列输入至编辑操作词表,得到字符序列;将所述字符序列输入至文本编辑模型,得到所述待处理文本序列对应的目标编辑预测序列;组合所述待处理文本序列和所述目标编辑预测序列形成目标文本序列;其中,所述文本编辑模型为根据所述待处理文本序列与编辑操作词表匹配所得的预设目标编辑序列进行训练得到。通过将处理待处理文本序列得到的字符序列输入至文本编辑模型,可得目标编辑预测序列;组合待处理文本序列和目标编辑预测序列形成目标文本序列;解决了存在的针对文本检测和纠错的不可控性问题。

    会议纪要生成方法、装置、计算机设备及存储介质

    公开(公告)号:CN112466306A

    公开(公告)日:2021-03-09

    申请号:CN201910766155.9

    申请日:2019-08-19

    Inventor: 许家铭 石晶 徐波

    Abstract: 本发明实施例涉及一种会议纪要生成方法、装置、计算机设备及存储介质,所述方法包括:调用语音采集设备采集会议过程的全程语音,调用图像采集设备采集会议过程的全程图像;从全程语音中提取单通道语音,从单通道语音中分别提取多个语音分段数据流;针对每个语音分段数据流,从全程图像中截取与该语音分段数据流对应的图像分段数据流;将每个语音分段数据流以及对应的图像分段数据流输入语音发出者检测模型,提取多个对应的语音发出者身份信息以及位置信息;将每个语音分段数据流,以及对应的语音发出者身份信息、位置信息输入语音识别模型,提取多个对应的语音转录文字;依次记录每个语音转录文字以及对应的语音发出者身份信息,生成会议纪要。

    基于UE引擎的表演捕捉系统

    公开(公告)号:CN108564643B

    公开(公告)日:2021-01-12

    申请号:CN201810217937.2

    申请日:2018-03-16

    Abstract: 本发明涉及计算机图形处理领域,提出了一种基于UE引擎的表演捕捉系统,旨在解决在同时捕捉动作与表情数据,生成角色动作与表情动画中,表情表演与动作表演的干扰问题,该系统包括:面部表演捕捉单元,配置为获取目标对象的面部图像数据,并根据该面部图像数据,确定目标对象的眼球旋转参数,并利用预设的基础表情库确定该目标对象的基础表情权重;动作表演捕捉单元,配置为利用绑缚于目标对象肢体的传感设备获取该目标对象的动作参数;动画生成单元,配置为根据上述基础表情权重、上述眼球旋转参数和上述动作参数确定虚拟角色的表情动画。本发明实现了表演者动作和表情的捕捉,并根据动作和表情数据赋予虚拟角色真实合理的动作与生动的表情。

    基于物理环境博弈的自主进化智能对话方法、系统、装置

    公开(公告)号:CN109800294B

    公开(公告)日:2020-10-13

    申请号:CN201910014369.0

    申请日:2019-01-08

    Abstract: 本发明属于人工智能及视觉对话领域,具体涉及了一种基于物理环境博弈的自主进化智能对话方法、系统、装置,旨在解决智能系统计算消耗大、收敛速度慢、处理信息精确度低的问题。本发明方法包括:获取待处理图像及对应问题文本;采用优化的对话模型将图片编码为图片向量,问题文本编码为问句向量;基于图片向量及问句向量生成状态向量;解码状态向量获得应答文本并输出。其中,对话模型的优化过程需引入判别器,对话模型与判别器交替优化直至对话模型的混合损失函数和判别器的损失函数值不再下降或低于预设值,完成模型优化。本发明方法与传统方法相比,计算消耗小、收敛速度快,进一步提高了处理信息的精确度。

    一种基于变量绑定和关系激活的自动问答方法

    公开(公告)号:CN107544960B

    公开(公告)日:2020-01-14

    申请号:CN201710755961.7

    申请日:2017-08-29

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于变量绑定和关系激活的自动问答方法。旨在解决现有技术难以模拟人脑精确推理出结果的问题。本发明的方法包括对文本和问句进行编码,得到文本的语义信息和问句的查询语句,识别文本中的实体,并对实体进行映射和跟踪,利用第一动作网络理解语义信息,确定实体在逻辑规则中的位置,利用第二动作网络激活实体关系,将实体关系写入逻辑规则,得到意象图式,利用查询语句对意象图式进行检索,根据检索结果生成答案词。本发明将实体位置和实体关系写入逻辑规则之后形成意象图式,能够作为先验知识存在,无需依赖大量的数据,即可产生与人脑类似的变量和关系序列,产生正确答案。

    语音增强方法、装置、存储介质、电子设备

    公开(公告)号:CN110503940A

    公开(公告)日:2019-11-26

    申请号:CN201910631894.7

    申请日:2019-07-12

    Abstract: 本发明实施例涉及一种语音增强方法、装置、存储介质、电子设备,所述方法包括:调用语音采集设备,采集当前环境中的语音;按照预设的语音处理算法,对所述语音进行处理,得到单通道语音;对所述单通道语音进行断句切分,得到包含预设类型声音的语音分段数据流;从所述语音分段数据流中提取语音特征;将所述语音特征输入预设的语音增强网络模型中,得到与所述语音特征对应的增强语音;将所述增强语音合成为语音段。由此,可以实现多场景的应用,避免了噪声的影响,考虑到语音特性,避免引入失真,从而避免对语音造成损伤。

Patent Agency Ranking