-
公开(公告)号:CN118506765A
公开(公告)日:2024-08-16
申请号:CN202310121258.6
申请日:2023-02-15
Applicant: 上海上湖信息技术有限公司
Abstract: 本申请公开了一种音频检测方法、计算设备及计算机可读存储介质,涉及语音处理技术领域。该方法包括:针对实时音频流中的待检测音频段,对待检测音频段中每一音频帧进行特征提取,得到每一音频帧对应的第一特征信息;针对任一音频帧,根据音频帧的第一特征信息和音频帧在待检测音频段中的参考音频帧的第一特征信息,得到音频帧的第二特征信息;将待检测音频段中各音频帧的第二特征信息通过分类器,得到每个音频帧的语音有效性识别结果;语音有效性识别结果包括有效帧、噪声帧或静音帧。上述的音频检测方法,可以准确的判断出无效语音,也就是噪声的起止时间,从而准确的剔除无效语音,提高了音频检测精准性。
-
公开(公告)号:CN115424619A
公开(公告)日:2022-12-02
申请号:CN202211021184.0
申请日:2022-08-24
Applicant: 上海上湖信息技术有限公司
Abstract: 一种号码状态识别方法及装置、计算机可读存储介质、终端,所述号码状态识别方法,包括:在外呼电话未接通时,抓取所述外呼电话的语音流;将所述语音流输入至声纹识别模型进行声纹识别,得到所述语音流对应的声纹特征,其中,所述声纹识别模型从所述语音流中提取原始音频信号特征以及时频特征,对所述原始音频信号特征及时频特征进行融合,基于融合结果得到所述声纹特征;将所述声纹特征与声纹数据库中预设的声纹样本进行相似度比对,基于相似度比对结果得到识别结果;基于所述识别结果确定所述外呼电话的号码状态类别。上述方案能够提高号码状态识别的有效性和时效性。
-
公开(公告)号:CN109600526A
公开(公告)日:2019-04-09
申请号:CN201910016001.8
申请日:2019-01-08
Applicant: 上海上湖信息技术有限公司
IPC: H04M3/51 , H04M3/22 , G10L21/0208
Abstract: 一种客户服务质量检测方法及装置、可读存储介质,所述客户服务质量检测方法包括:获取实时的双声道音频数据;根据所述双声道音频数据,得到左声道音频数据和右声道音频数据;分别对所述左声道音频数据和所述右声道音频数据进行语音增强,得到降噪后的左声道音频数据和降噪后的右声道音频数据;分别对所述降噪后的左声道音频数据和所述降噪后的右声道音频数据进行人声区域检测,得到左声道人声区域和右声道人声区域;当所述左声道人声区域和所述右声道人声区域存在人声重叠区域时,判定客户服务质量存在问题。采用上述方案,可以有效地检测客户服务质量。
-
公开(公告)号:CN110321883A
公开(公告)日:2019-10-11
申请号:CN201910517600.8
申请日:2019-06-14
Applicant: 上海上湖信息技术有限公司
Abstract: 一种验证码识别方法及装置、可读存储介质,所述验证码识别方法包括:对待识别图像进行预处理,得到处理后的图像;将所述处理后的图像输入CTC识别模型,得到所述待识别图像所包含的字符;所述CTC识别模型的输出层为Softmax层;去除所述字符中的空字符,得到所述待识别图像中的验证码。采用上述方案,可以有效识别不定长字符图像的验证码。
-
-
-