-
公开(公告)号:CN110334244A
公开(公告)日:2019-10-15
申请号:CN201910624692.X
申请日:2019-07-11
Applicant: 出门问问信息科技有限公司
Abstract: 本发明提供了一种数据处理的方法、装置及电子设备,用于解决现有技术中无法确定关键词在音频数据中的位置,影响关键词检出系统的性能的问题。包括:获取音频数据中的目标帧;确定目标帧的顶层特征向量序列;根据顶层特征向量序列确定出目标帧锚框的后验概率向量序列、以及目标帧锚框的空间变换参数向量序列;确定目标帧锚框的后验概率向量序列中的最大值、以及最大值对应的目标锚框;若最大值大于设定阈值,则确定最大值对应的目标锚框的第一时刻存在关键词;根据第一时刻以及目标锚框的长度,确定目标锚框对应的第二时刻;根据目标锚框的起始位置和结束位置,以及锚框对应的空间变换参数向量,确定出关键词的实际起止位置。
-
公开(公告)号:CN110334244B
公开(公告)日:2020-06-09
申请号:CN201910624692.X
申请日:2019-07-11
Applicant: 出门问问信息科技有限公司
Abstract: 本发明提供了一种数据处理的方法、装置及电子设备,用于解决现有技术中无法确定关键词在音频数据中的位置,影响关键词检出系统的性能的问题。包括:获取音频数据中的目标帧;确定目标帧的顶层特征向量序列;根据顶层特征向量序列确定出目标帧锚框的后验概率向量序列、以及目标帧锚框的空间变换参数向量序列;确定目标帧锚框的后验概率向量序列中的最大值、以及最大值对应的目标锚框;若最大值大于设定阈值,则确定最大值对应的目标锚框的第一时刻存在关键词;根据第一时刻以及目标锚框的长度,确定目标锚框对应的第二时刻;根据目标锚框的起始位置和结束位置,以及锚框对应的空间变换参数向量,确定出关键词的实际起止位置。
-