-
公开(公告)号:CN114564575A
公开(公告)日:2022-05-31
申请号:CN202210058001.6
申请日:2022-01-19
Applicant: 桂林理工大学
Abstract: 本发明涉及人工智能技术领域,具体涉及一种基于倾斜随机森林的处理大量文本中识别不良文本的方法,包括读取文本数据;对文本数据进行预处理,得到文本向量;建立不良文本词典对所述文本向量进行不良率判断,若判断不合格则将所述文本向量定义为不良文本;若判断合格则得到文本集合并执行下一步;基于文本集合,利用随机森林构建倾斜随机森林分类模型;利用倾斜随机森林分类模型对文本向量进行分类,得到文本分类结果,通过倾斜随机森林分类模型得出的分类结果准确率较高,解决了传统的随机森林算法分类的准确率较低的问题。
-
公开(公告)号:CN116110415A
公开(公告)日:2023-05-12
申请号:CN202211644919.5
申请日:2022-12-20
Applicant: 桂林理工大学
Abstract: 本发明公开了一种基于BERT的非平行语料下的语音转换方法,属于语音信号处理技术领域。在模型训练过程中,首先由音频特征算法从音素语料库提取语音特征,将特征导入到音素识别模块进行训练;接着对目标语音进行音频特征提取,然后导入到音素识别模型得到目标语音的音素特征;最后将音素特征和目标语音特征导入到特征转换模型,共同完成语音特征转换训练。在语音转换过程中,利用特征算法对源语音进行特征提取,然后输出到音素识别模块得到其音素特征,再将其输出到特征转换模块即可实现语音特征转换,最后进入语音合成模块获得转换后的语音。本方法将音素提取及特征转换应用在BERT模型中,运算简洁,为非平行语料转换提供技术支撑。
-
公开(公告)号:CN116013356A
公开(公告)日:2023-04-25
申请号:CN202211728723.4
申请日:2022-12-30
Applicant: 桂林理工大学
Abstract: 本发明涉及语音信号处理技术领域,具体涉及一种基于不同说话人的语音内容过滤方法,采用轻量化结构的声纹网络进行声纹注册,再将需要查询的声纹特征输入进行识别输出结果。首先,根据不同的预存说话人信息,构造专属敏感词袋。采用声纹识别判断使用者的具体身份,实现个性化过滤。其次,通过语音识别技术,获取说话内容信息,比对敏感词进行过滤。最后,将剔除相关内容的文字通过合成技术完成输出。进一步的,本发明采用轻量级网络结构,减少在移动端等部署器的开销。
-
-