音频识别方法、声学模型训练方法、装置和存储介质

    公开(公告)号:CN115512693B

    公开(公告)日:2024-08-09

    申请号:CN202110696328.1

    申请日:2021-06-23

    Abstract: 本发明公开了一种音频识别方法、声学模型训练方法、装置和存储介质,其中,音频识别方法包括:获取待识别的音频数据;对音频数据进行频域特征提取,生成音频数据的频谱图;将频谱图输入到训练好的声学模型中,通过声学模型中的特征提取网络提取频谱图对应的声学特征序列,其中,声学特征序列包括采用不同尺度的卷积核得到的浅层特征和深层特征;通过声学模型中的识别网络,基于声学特征序列进行音频数据的识别。由于声学模型中的特征提取网络提取出的声学特征序列中既包含了音频数据的深层特征,也包含了音频数据的浅层特征,从而使得声学模型中的识别网络能够充分利用音频数据的高低层特征进行语音识别,提高了对语音识别的准确率。

    一种推送工单的方法、系统及计算机存储介质

    公开(公告)号:CN111178647B

    公开(公告)日:2023-09-05

    申请号:CN201811329290.9

    申请日:2018-11-09

    Abstract: 本发明公开了一种推送工单的方法、系统及计算机存储介质,用以解决现有技术中存在的对上门服务人员进行推单时推送不够及时、精准的技术问题。包括:根据新工单所属的区域,从所有上门服务人员中筛选出在所述区域内的区域上门服务人员;按时间顺序将新工单分别与区域上门服务人员中每个上门服务人员的历史工单组建,获得每个上门服务员的新工单序列;其中,历史工单为每个上门服务人员,在新工单对应的接单时间之前已完成的指定数量的工单;基于每个新工单序列,用训练好的深度学习模型计算每个上门服务人员对新工单进行抢单的新工单抢单概率;基于区域上门服务人员对应的所有新工单抢单概率及指定阈值,筛选推单人员;并将新工单推送给推单人员。

    手势区间的检测方法及装置

    公开(公告)号:CN110378169B

    公开(公告)日:2021-06-18

    申请号:CN201810326692.7

    申请日:2018-04-12

    Abstract: 本申请实施例中公开了一种手势区间的检测方法及装置。该方法获取多个包括实时采集的第一预设数量个加速度数据的数据区间,之后将第一数据区间的每个第一加速度数据,采用双曲正切函数,得到第一预设数量个变换后的加速度数据,第一数据区间为多个数据区间中的任一数据区间;将第一预设数量个变换后的加速度数据,采用预设离散算法,得到第一数据区间的离散度;基于第一数据区间的离散度与预设离散度阈值的比较结果,确定出第一数据区间是否为手势区间。该方法提高了检测手势区间的性可以实时、准确的完成手势区间和非手势区间的区分,并能够给出手势信号的起始点和结束点,提升了用户体验。

    命名实体识别方法及系统、电子设备及存储介质

    公开(公告)号:CN112487813A

    公开(公告)日:2021-03-12

    申请号:CN202011334112.2

    申请日:2020-11-24

    Abstract: 本发明实施例涉及自然语言处理领域,公开了一种命名实体识别方法及系统、电子设备及存储介质,方法包括:获取第一标签序列和第二标签序列;其中,第一标签序列是用词向量识别文本的结果,第二标签序列是用字向量识别文本的结果;选择第一标签序列与第二标签序列中识别文本的准确率更高的标签序列作为输出标签序列。在本发明中,分别用词向量和字向量表征文本,生成第一标签序列和第二标签序列,选择第一标签序列和第二标签序列中识别准确率更高的标签序列作为输出标签序列。由于词向量方式和字向量方式各自针对某些句型有更好的识别效果,故同时结合词向量方式和字向量方式表征文本的优势,会在一定程度上提升中文命名实体识别的效果。

    音量调节的方法、装置、电子设备和存储介质

    公开(公告)号:CN112037771B

    公开(公告)日:2024-03-12

    申请号:CN202010886561.1

    申请日:2020-08-28

    Abstract: 本发明实施例涉及语音识别领域,公开了一种音量调节的方法、装置、电子设备和存储介质。上述音量调节的方法包括:获取用于训练语音识别模型的训练集中的各音频样本;其中,所述语音识别模型用于语音识别;确定所述训练集中的各音频样本的音量值;根据所述各音频样本的音量值,确定所述训练集的音量基准值;根据所述音量基准值,对所述各音频样本的音量值进行调节;其中,调节后的所述各音频样本的音量值与所述音量基准值的差值在预设的差值范围内。本发明实施例提供的音量调节的方法可以基于整个训练集对每条音频数据进行音量调节,合适地调整训练集中音频样本的音量值,从而提升语音识别模型的识别效果。

    文本模型训练方法、文本纠错方法、电子设备及存储介质

    公开(公告)号:CN111209740A

    公开(公告)日:2020-05-29

    申请号:CN201911419034.3

    申请日:2019-12-31

    Abstract: 本发明实施例涉及深度学习领域,公开了文本模型训练方法、文本纠错方法、电子设备及存储介质。本发明中,将语音对话进行文本转换,得到错误文本,对错误文本进行纠错,得到正确文本,根据热词表对错误文本以及正确文本进行分词;之后对分词后的文本样本进行编码得到的文本训练样本,将文本输入样本输入至深度神经网络中进行训练,得到目标文本模型。相对于现有技术基于规则的模型或者基于统计的模型进行文本纠错而言,分词精确度更高,提高了模型训练得到的目标文本模型的纠错准确率。另外,基于建立的目标文本模型进行纠错,在纠错过程中仅需输入错误句子即可得到正确句子,减少了纠错过程中的工作量以及成本。

    命名实体识别方法及系统、电子设备及存储介质

    公开(公告)号:CN112487813B

    公开(公告)日:2024-05-10

    申请号:CN202011334112.2

    申请日:2020-11-24

    Abstract: 本发明实施例涉及自然语言处理领域,公开了一种命名实体识别方法及系统、电子设备及存储介质,方法包括:获取第一标签序列和第二标签序列;其中,第一标签序列是用词向量识别文本的结果,第二标签序列是用字向量识别文本的结果;选择第一标签序列与第二标签序列中识别文本的准确率更高的标签序列作为输出标签序列。在本发明中,分别用词向量和字向量表征文本,生成第一标签序列和第二标签序列,选择第一标签序列和第二标签序列中识别准确率更高的标签序列作为输出标签序列。由于词向量方式和字向量方式各自针对某些句型有更好的识别效果,故同时结合词向量方式和字向量方式表征文本的优势,会在一定程度上提升中文命名实体识别的效果。

    一种语音质检的方法和设备

    公开(公告)号:CN111179935B

    公开(公告)日:2022-06-28

    申请号:CN201811341896.4

    申请日:2018-11-12

    Abstract: 本发明公开了一种语音质检的方法和设备,用以解决现有技术中存在无法有效地智能化地对客服人员服务用语是否规范进行质检的问题。本发明实施例中,终端首先根据预设的关键词集合,从由用户的语音识别出的服务文本信息提取出对应的关键词,再根据确定的所有的关键词建立词向量,随后将词向量输入到关键词分类模型当中,并根据输出结果确定所述用户的语音质检结果。如此,终端可以依据从由用户的语音识别出的服务文本信息提取出的关键词对用户的服务用语是否规范进行质检,故本发明中提供了一种根据由用户的语音识别出的服务文本信息对用户服务用语是否规范进行质检的方法。

Patent Agency Ranking