-
公开(公告)号:CN116564279A
公开(公告)日:2023-08-08
申请号:CN202310612970.6
申请日:2023-05-26
Applicant: 广州汇智通信技术有限公司
Abstract: 本申请公开了一种语音关键词识别方法、装置及相关设备,该方法包括:提取待识别语音的梅尔频率倒谱系数MFCC特征,并将所述MFCC特征输入关键词模型,得到所述待识别语音的识别结果,所述识别结果包括所述待识别语音中包含的各关键词以及每一关键词在所述待识别语音中的定位信息;其中,所述关键词模型包括预设的自注意力网络,所述关键词模型为利用增强后的小语种语音样本对所述自注意力网络进行训练而得到的。经过对有限的小语种语音样本的增强处理,实现了小语种语音样本在多个维度下的扩充,减少了标注成本的同时,缩短了获取足够多小语种语音样本的时间,以便于快速开发相应语音关键音识别应用。
-
公开(公告)号:CN115186652A
公开(公告)日:2022-10-14
申请号:CN202210820489.1
申请日:2022-07-13
Applicant: 广州汇智通信技术有限公司
IPC: G06F40/211 , G06F40/258 , G06F16/33 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种文本主题分类方法、装置、设备及存储介质,包括:获取用户输入的信息文本,信息文本包含至少一个文本主题;确定与至少一个文本主题对应的一级标签;确定预定义主题的锚定词,根据锚定词对每一文本主题下的句子进行聚类,得到每一文本主题下的多个聚类结果;根据信息文本与每一文本主题之间的相关性,确定每一文本主题下的每一聚类结果在信息文本的任一句段中的概率分布;依据每一文本主题下的每一聚类结果在信息文本的任一句段中的概率分布,将每一文本主题下概率最高的聚类结果作为每一文本主题下的二级标签,以相关性转换为概率分布的方式表征信息文本与文本主题之间的关联度,故而可控性和可解释性较好,使聚类结果更加切实。
-