音频识别方法、声学模型训练方法、装置和存储介质

    公开(公告)号:CN115512693B

    公开(公告)日:2024-08-09

    申请号:CN202110696328.1

    申请日:2021-06-23

    Abstract: 本发明公开了一种音频识别方法、声学模型训练方法、装置和存储介质,其中,音频识别方法包括:获取待识别的音频数据;对音频数据进行频域特征提取,生成音频数据的频谱图;将频谱图输入到训练好的声学模型中,通过声学模型中的特征提取网络提取频谱图对应的声学特征序列,其中,声学特征序列包括采用不同尺度的卷积核得到的浅层特征和深层特征;通过声学模型中的识别网络,基于声学特征序列进行音频数据的识别。由于声学模型中的特征提取网络提取出的声学特征序列中既包含了音频数据的深层特征,也包含了音频数据的浅层特征,从而使得声学模型中的识别网络能够充分利用音频数据的高低层特征进行语音识别,提高了对语音识别的准确率。

    命令词识别方法、装置、设备及存储介质

    公开(公告)号:CN117409770A

    公开(公告)日:2024-01-16

    申请号:CN202310934276.6

    申请日:2023-07-27

    Abstract: 本申请涉及语音识别技术领域,提供一种命令词识别方法、装置、设备及存储介质。所述方法包括获取待识别的语音信息,并提取所述语音信息的音频特征;对所述音频特征进行压缩处理,并将压缩后的音频特征输入到经过预训练的命令词识别模型中,对所述语音信息中的命令词进行识别。本申请实施例提供的命令词识别方法,通过对音频特征进行压缩,可以剔除音频特征中的静音片段等无效信息,将压缩后的音频特征输入到经过预训练的命令词识别模型,对语音信息中的命令词进行识别时,可以避免或减少数据填充,从而减少计算资源的浪费。

    一种推送工单的方法、系统及计算机存储介质

    公开(公告)号:CN111178647B

    公开(公告)日:2023-09-05

    申请号:CN201811329290.9

    申请日:2018-11-09

    Abstract: 本发明公开了一种推送工单的方法、系统及计算机存储介质,用以解决现有技术中存在的对上门服务人员进行推单时推送不够及时、精准的技术问题。包括:根据新工单所属的区域,从所有上门服务人员中筛选出在所述区域内的区域上门服务人员;按时间顺序将新工单分别与区域上门服务人员中每个上门服务人员的历史工单组建,获得每个上门服务员的新工单序列;其中,历史工单为每个上门服务人员,在新工单对应的接单时间之前已完成的指定数量的工单;基于每个新工单序列,用训练好的深度学习模型计算每个上门服务人员对新工单进行抢单的新工单抢单概率;基于区域上门服务人员对应的所有新工单抢单概率及指定阈值,筛选推单人员;并将新工单推送给推单人员。

    流式语音识别方法、终端设备及介质

    公开(公告)号:CN113838468A

    公开(公告)日:2021-12-24

    申请号:CN202111119338.5

    申请日:2021-09-24

    Abstract: 本发明公开了一种流式语音识别方法,终端设备及计算机可读存储介质。所述方法包括:获取词嵌入特征序列以及音频流对应音频特征序列;通过音频编码器对所述音频特征序列进行编码,得到音频上下文序列,以及根据标签编码器对所述词嵌入序列进行编码,得到文本上下文序列,其中,所述音频编码器和所述标签编码器为基于相对位置编码的自注意力编码器;将所述音频上下文序列和所述文本上下文序列输入联合解码器,得到标签的概率分布结果,并根据所述概率分布结果确定识别结果。本发明旨在达成减少语音识别的计算量的效果。

    手势区间的检测方法及装置

    公开(公告)号:CN110378169B

    公开(公告)日:2021-06-18

    申请号:CN201810326692.7

    申请日:2018-04-12

    Abstract: 本申请实施例中公开了一种手势区间的检测方法及装置。该方法获取多个包括实时采集的第一预设数量个加速度数据的数据区间,之后将第一数据区间的每个第一加速度数据,采用双曲正切函数,得到第一预设数量个变换后的加速度数据,第一数据区间为多个数据区间中的任一数据区间;将第一预设数量个变换后的加速度数据,采用预设离散算法,得到第一数据区间的离散度;基于第一数据区间的离散度与预设离散度阈值的比较结果,确定出第一数据区间是否为手势区间。该方法提高了检测手势区间的性可以实时、准确的完成手势区间和非手势区间的区分,并能够给出手势信号的起始点和结束点,提升了用户体验。

    命名实体识别方法及系统、电子设备及存储介质

    公开(公告)号:CN112487813A

    公开(公告)日:2021-03-12

    申请号:CN202011334112.2

    申请日:2020-11-24

    Abstract: 本发明实施例涉及自然语言处理领域,公开了一种命名实体识别方法及系统、电子设备及存储介质,方法包括:获取第一标签序列和第二标签序列;其中,第一标签序列是用词向量识别文本的结果,第二标签序列是用字向量识别文本的结果;选择第一标签序列与第二标签序列中识别文本的准确率更高的标签序列作为输出标签序列。在本发明中,分别用词向量和字向量表征文本,生成第一标签序列和第二标签序列,选择第一标签序列和第二标签序列中识别准确率更高的标签序列作为输出标签序列。由于词向量方式和字向量方式各自针对某些句型有更好的识别效果,故同时结合词向量方式和字向量方式表征文本的优势,会在一定程度上提升中文命名实体识别的效果。

    命名实体识别方法及系统、电子设备及存储介质

    公开(公告)号:CN112487813B

    公开(公告)日:2024-05-10

    申请号:CN202011334112.2

    申请日:2020-11-24

    Abstract: 本发明实施例涉及自然语言处理领域,公开了一种命名实体识别方法及系统、电子设备及存储介质,方法包括:获取第一标签序列和第二标签序列;其中,第一标签序列是用词向量识别文本的结果,第二标签序列是用字向量识别文本的结果;选择第一标签序列与第二标签序列中识别文本的准确率更高的标签序列作为输出标签序列。在本发明中,分别用词向量和字向量表征文本,生成第一标签序列和第二标签序列,选择第一标签序列和第二标签序列中识别准确率更高的标签序列作为输出标签序列。由于词向量方式和字向量方式各自针对某些句型有更好的识别效果,故同时结合词向量方式和字向量方式表征文本的优势,会在一定程度上提升中文命名实体识别的效果。

    模型更新方法、装置、设备及存储介质

    公开(公告)号:CN116913253A

    公开(公告)日:2023-10-20

    申请号:CN202211351580.X

    申请日:2022-10-31

    Abstract: 本公开实施例公开了一种模型更新方法、装置、设备及存储介质,其中,所述方法包括:响应于接收用户终端发送的音频信息,利用平台端的平台模型对音频信息进行识别,得到第一识别结果;将第一识别结果发送至用户终端;接收用户终端上传的更新后的端侧模型;其中,更新后的端侧模型是用户终端基于第一识别结果和第二识别结果对初始的端侧模型进行更新得到的,第二识别结果是由端侧模型对音频信息进行识别得到的;对更新后的端侧模型和平台模型进行融合,得到更新后的平台模型。本公开实施例可以提高模型更新的效率和自动化程度。

Patent Agency Ranking